[ad_1]
Au cours des six dernières années, l’audio parlé – qui comprend les actualités, les sports, les discussions/personnalités et les livres audio – a augmenté de 30 %, augmentant encore de 8 % en 2020. Ceux qui écoutent l’audio parlé en moyenne environ deux heures d’écoute par jour— soit près de la moitié (48 %) de leur temps d’écoute quotidien au total.
Malgré cette accélération de l’écoute dans notre ère numérique actuelle, le contenu audio est l’un des supports qui arrive en dernier dans la course au progrès technologique. Bien qu’il soit utilisé dans toutes les industries et que le besoin soit certainement là, certaines particularités de la création de clips audio ont inhibé son automatisation.
En effet, certains éléments clés de la création audio ne peuvent pas être facilement reproduits par la technologie, en particulier lorsqu’il s’agit d’essayer de créer numériquement de la parole. Ce sont des choses comme le rythme, le ton, le temps, la cadence et l’inflexion contextuelle de la voix, qui sont toutes essentielles pour que l’audio satisfasse suffisamment les oreilles des auditeurs pour vraiment s’engager.
Une entreprise, Aflorithmique, ouvre la voie en aidant à innover le contenu audio pour l’avenir avec la première solution entièrement automatisable au monde pour l’audio de bout en bout. Leur plate-forme « Audio-As-A-Service » aidera la création audio à rattraper le reste des innovations technologiques en progression rapide dans la création de contenu et permettra à l’audio de suivre le rythme de sa consommation actuelle.
La transition de la consommation visuelle
Les gens sont maximisés sur le temps d’écran, avec plus de 50 % des adultes augmentent leur temps d’écran sur au moins deux appareils différents au cours de l’année écoulée, ce qui a conduit les individus à rechercher des alternatives dans la consommation de contenu. C’est là que l’audio monte en puissance. L’audio possède également ses propres avantages que le contenu visuel n’a pas, comme permettre aux auditeurs d’effectuer plusieurs tâches tout en écoutant, comme dans le cas de l’entraînement ou de la préparation d’un repas.
Pourtant, un processus rigide et linéaire a été le seul moyen de produire de l’audio à ce jour, et être enfermé dans ce processus de production audio hautement manuel rend difficile l’apport rapide et facile de clips audio aux auditeurs. Les erreurs peuvent coûter beaucoup d’argent et de temps, ce qui a handicapé l’ampleur de sa production à l’ère numérique.
La société Aflorithmic change cela en proposant une plateforme qui inclut toute la chaîne de production audio. Leur plate-forme montre qu’un contenu rapide et digeste est possible dans le monde du son, grâce à une plate-forme audio AI intuitive et entièrement chargée qui aide les producteurs à créer un son de qualité du début à la fin. Aflorithmic se concentre particulièrement sur la progression de la composante audio la plus délicate de la voix synthétique, qui à ce jour a été difficile à reproduire numériquement car elle est limitée à très peu d’éléments de l’intonation du locuteur humain.
Jusqu’à présent, la plupart des entreprises de médias synthétiques s’arrêtent une fois que la synthèse vocale a été créée, révélant un clip audio qui est simplement un lecteur d’écran sans les éléments nécessaires à l’engagement de l’auditeur. Les plates-formes d’IA aident à faire passer le contenu audio au niveau supérieur en fournissant les outils de création audio qui font la différence entre un lecteur d’écran et un podcast.
API pour l’audio
Aflorithmic est une solution basée sur l’API, ce qui signifie que l’entreprise intègre ses API à votre système au lieu d’obliger les utilisateurs à apprendre un tout nouveau système graphique. L’avantage de ceci est que vous avez une flexibilité maximale et que vous pouvez exécuter Aflorithmic sous le capot, sans avoir à le dire à personne, tandis que les développeurs expérimentés facilitent.
« C’est un choix que nous avons fait délibérément », a déclaré Matthias Lehman à Aflorithmic. « Nous aidons les producteurs à utiliser leurs propres plates-formes pour adapter l’audio au sein du studio de création de leur choix. »
Les API d’Aflorithmics se composent de trois services principaux qui reflètent le processus de production audio traditionnel. Le premier est un « script », où vous créez un texte que vous voulez qu’une ou plusieurs voix synthétiques disent, qui peut être exécuté manuellement ou automatiquement à partir d’un document ou d’une base de données.
Le deuxième service s’appelle « la parole » et, comme son nom l’indique, c’est la partie du processus où la parole est rendue. Aflorithmic propose plus de 400 voix des meilleurs fournisseurs de synthèse vocale et chaque mois, des dizaines d’autres sont ajoutées, ce qui signifie qu’elles s’occupent de la compatibilité et de la maintenance requises, supprimant une grande partie du travail pour le client.
« C’est l’étape où vous pouvez personnaliser votre audio et créer des milliers de versions de type en quelques secondes », a déclaré Lehmann. « Ce service agit comme une alternative à votre configuration traditionnelle d’acteur vocal et de studio de son. »
Le troisième et dernier service s’appelle « Mastering » et c’est là que la vraie magie opère. Les utilisateurs peuvent sélectionner une conception sonore alimentée par l’IA qui s’adapte automatiquement à la longueur du discours nécessaire. Le son a également la capacité de changer en fonction de ce qui se passe dans votre script – pourquoi Aflorithmic l’appelle conception sonore plutôt que musique de fond, car le service agit en tant qu’ingénieur du son et de mastering.
Nouvelles chaînes pour l’audio
Grâce à ces accélérations de l’IA, l’influence de l’audio automatisé s’accroît pour pénétrer et transformer les industries qui ne l’ont pas encore utilisé. En réalité, près d’un quart de toutes les publicités radio aux États-Unis devraient être automatisées d’ici 2022. La production audio automatisée peut aider à mettre à l’échelle et à adapter les produits finalisés dans la création de contenu, en développant des milliers de versions qui peuvent être produites en quelques secondes.
« L’adaptabilité signifie réutiliser le contenu existant et le transformer en une expérience audio », a déclaré Lehmann. « L’audio est un format qui peut être utilisé pour promouvoir votre contenu écrit en proposant un résumé ou un ‘snack content’ en tant qu’audio sur des formats tels que les histoires Instagram. Une autre option consiste à monétiser le nouveau contenu audio que vous avez créé à partir de votre contenu existant, en y plaçant des publicités ou en le sponsorisant par une entreprise.
Il n’est pas étonnant que le secteur de l’édition soit une industrie désireuse d’exploiter ce nouvel élan audio. Les petits éditeurs recherchant particulièrement une solution pour créer rapidement et à moindre coût un contenu agréable – en raison de leur manque de ressources internes, l’audio automatisé offre une énorme opportunité, et avec des marges en baisse dans ce secteur dans son ensemble – cela maintenant s’applique même aux grandes maisons de presse.
Twitter a été la plate-forme exemplaire pour le contenu rapide car il est conçu pour les messages courts et les mises à jour rapides pour les consommateurs, mais les «blurbs» audio pourraient également être une nouvelle avenue remarquable pour traduire les mises à jour rapides. Si les sociétés de médias en profitent, cela remet le pouvoir entre les mains des sociétés d’édition, et les producteurs de contenu n’auront pas à vendre autant de leur temps d’antenne aux annonceurs pour rester à flot.
Avec un moyen rentable de produire du contenu audio, même compte tenu de la courte durée de vie d’un article d’actualité, l’audio synthétique se fait une place où l’évolutivité et la vitesse sont vitales. C’est probablement la raison pour laquelle Aflorithmic a pu s’appuyer sur une collaboration avec journal régional allemand HNA pour créer des bulletins d’information automatisés avec plus de 7 millions de lecteurs mensuels afin d’automatiser les nouvelles. Le 4 mars dernier, le journal télévisé HNA a célébré son 100e épisode, amassant plus de 500 000 lectures.
Aflorithmic a réalisé la plus grande capacité audio pour les temps modernes, et avec elle a ouvert de nouvelles portes à sa production de contenu. Grâce à leur plate-forme, le contenu audio peut être utilisé pour n’importe quelle pièce écrite, transformant n’importe quel contenu en une expérience audio qui est une expérience sur mesure adaptée à l’intérêt individuel de chaque auditeur.
[ad_2]
Source link