• About Us
  • Privacy Policy
  • Terms of Use
  • Cookies Policy
samedi, 2 août 2025
TheBuzzly News | Dernières nouvelles | Rapports originaux
  • ACCUEIL
  • COMMENT FAIRE
    • All
    • SEO
    • WINDOWS 10
    • WINDOWS 11
    Bloquer l'accès à certains sites web avec le fichier hosts

    Bloquer l’accès à certains sites Web avec le fichier hosts

    Définir Google Chrome comme navigateur web par défaut sur Windows 11

    Définir Chrome comme navigateur par défaut sur Windows 11

    Un outil de peinture gratuit pour Windows, macOS et Linux

    Paw : Gestionnaire de mots de passe

    un gestionnaire de mots de passe simple et axé sur la confidentialité

    MediCat

    la meilleure boîte à outils pour le dépannage informatique

    Stasher

    masquer les dossiers sensibles sous Windows

    Installer macOS Sonoma sur PC avec VMware

    Installez macOS Sonoma sur un PC Windows avec VMware

    5 Expert Ways: How to Screenshot on Chromebook with Ease

    5 Expert Ways: How to Screenshot on Chromebook with Ease

    Right-Click Uninstall

    Désinstallez les applications sous Windows par un simple clic droit

    • WINDOWS 11
    • SEO
  • TECH
    • All
    • Apps
    • Mobile
    Sora : le générateur de vidéos par IA d’OpenAI

    Sora : la création de vidéos par intelligence artificielle d’OpenAI

    Micron to Start Plant Construction in August, Domestic Microchip Production to Begin by 2024-End: Report

    Micron commencera la construction de l’usine en août, la production nationale de micropuces commencera d’ici 2024-fin : rapport

    Twitter to Discontinue Newsletter Product Revue in 2023 Amid Elon Musk

    Twitter limite le nombre de tweets que les utilisateurs gratuits et vérifiés peuvent lire, aucun accès sans compte

    iPhone Supplier Foxconn to Invest $250 Million for EV Components Unit in Vietnam

    Le fournisseur d’iPhone Foxconn investira 250 millions de dollars dans une unité de composants EV au Vietnam

    • CRYPTO-MONNAIES
  • DIVERTISSEMENT
    • All
    • FILM
    • Gaming
    • Musique
    Chrissy Teigen a répondu à un commentaire Instagram qui interrogeait son « nouveau visage ».

    Chrissy Teigen a répondu à un commentaire Instagram qui interrogeait son « nouveau visage ».

    Eva Green - Getty Images

    Eva Green marquée après une scène de s*xe violente

    Exit Kim Kardashian, Taylor Swift est la nouvelle reine d'Instagram

    Adieu Kim Kardashian, Taylor Swift devient la nouvelle reine d’Instagram

    6 incroyables mystères historiques découverts par les utilisateurs de Reddit

    6 incroyables mystères historiques découverts par les utilisateurs de Reddit

    • CINÉMA
    • FILM
    • Musique
    • Gaming
  • MODE DE VIE
    • All
    • Mode
    • Santé
    8 caractéristiques communes d'un modèle de rôle

    8 caractéristiques communes d’un modèle de rôle

    Cinq conseils pour protéger votre espace personnel

    Cinq conseils pour protéger votre espace personnel

    7 histoires de réussite inspirantes en matière de finances personnelles d'utilisateurs de Reddit - Apprenez les secrets de la liberté financière !

    7 histoires de réussite inspirantes en matière de finances personnelles d’utilisateurs de Reddit – Apprenez les secrets de la liberté financière !

    8 histoires inspirantes sur l'autonomisation et la réussite des femmes - préparez-vous à être motivée !

    8 histoires inspirantes sur l’autonomisation et la réussite des femmes – préparez-vous à être motivée !

    • Voyage
    • Mode
  • BEAUTÉ
    rouge à lèvres MAC

    Rouge à Lèvres MAC : Découvrez les Derniers Ajouts à la Collection

    Leighton Meester Patrick Heusinger dans Gossip Girl

    Jennifer Lopez est le Blair Waldorf des Hamptons en fleurs et une ceinture massive

    6 options pour le redressement des dents adultes

    6 options pour le redressement des dents adultes

    J'ai fait Glastonbury sobre et voici ce que j'ai appris

    J’ai fait Glastonbury sobre et voici ce que j’ai appris

  • English Story

    How a Boy’s Kindness Touched an Elderly Man

    I Attended My Husband’s Office Party for the First Time, but I Never Expected to See His Other ‘Wife’ There

    The Man, the Mystery, and the Cable: A Medical Case That Stunned a Hospital

    A Nurse, a Photograph, and a Lifelong Memory: Amanda’s Search for the Woman Who Comforted Her

    A Nurse, a Photograph, and a Lifelong Memory: Amanda’s Search for the Woman Who Comforted Her

    A Gallon of Kindness: A Boston Officer’s Quiet Act of Compassion Amid Chaos

    A Gallon of Kindness: A Boston Officer’s Quiet Act of Compassion Amid Chaos

    From Near Death to New Life: A $8,000 Journey of Hope for These Rescued Dogs

    One Month With Our Miracle: An Update on Lily Grace

    The World’s Richest Royal Family You’ve Never Heard Of: Inside the Lavish Life of the House of Saud

    An Unexpected Blessing on the Side of the Road

    The Girl in the Photograph: A Heartbreaking Glimpse into Auschwitz

    The Frozen Mystery of Everest: The Day Conrad Anker Found George Mallory

    A Stranger’s Kindness in a Walmart Parking Lot: How One Man Changed My Son’s Day

    Trending Tags

    • Story
    • Family
    • Boy
    • Doctor
No Result
View All Result
TheBuzzly News | Dernières nouvelles | Rapports originaux
No Result
View All Result
Home TECH

Microsoft dévoile VALL-E, une IA audio capable de simuler n’importe quelle voix à partir d’invites de 3 secondes

Microsoft dévoile VALL-E, une IA audio capable de simuler n'importe quelle voix à partir d'invites de 3 secondes

#image_title

Partager sur FacebookPartager sur TwitterPartager sur WhatsApp

[ad_1]

Les chercheurs de Microsoft ont récemment annoncé VALL-E, un nouveau modèle d’IA de synthèse vocale qui peut imiter avec précision la voix d’une personne lorsqu’on lui donne un échantillon audio de trois secondes. Une fois qu’il a appris une voix spécifique, VALL-E peut synthétiser l’audio de cette personne disant n’importe quoi, tout en essayant de conserver le ton émotionnel de l’orateur. Lorsqu’il est combiné avec d’autres modèles d’IA génératifs comme GPT-3, les créateurs de VALL-E pensent qu’il peut être utilisé pour des applications de synthèse vocale de haute qualité, l’édition de la parole dans laquelle un enregistrement d’une personne pourrait être édité et modifié à partir d’une transcription de texte (en leur faisant dire quelque chose qu’ils n’ont pas dit) et la création de contenu audio.

Selon Microsoft, VALL-E est principalement un « modèle de langage de codec neuronal », et est basé sur EnCodec, que Meta a révélé en octobre 2022. VALL-E crée des codes de codec audio discrets à partir de texte et d’invites acoustiques, par opposition à d’autres méthodes de synthèse vocale qui synthétisent généralement la parole par manipulation des formes d’onde. Il traite le son d’une personne, décompose les données pertinentes en composants discrets (appelés « jetons ») à l’aide d’EnCodec, puis utilise des données d’entraînement pour faire correspondre ce qu’il « sait » sur la façon dont cette voix pourrait sonner si elle prononçait d’autres phrases au-delà. l’échantillon de trois secondes.

Microsoft a formé les fonctionnalités de synthèse vocale de VALL-E à l’aide de la bibliothèque audio LibriLight de Meta. Il comprend 60 000 heures de discours en anglais de plus de 7 000 locuteurs, provenant principalement des livres audio du domaine public LibriVox. La voix dans l’échantillon de trois secondes doit ressembler étroitement à une voix dans l’algorithme d’apprentissage de VALL-E pour produire un bon résultat.

Le géant américain de la technologie propose des dizaines d’exemples audio du modèle d’IA en action sur le Exemple de site Web VALL-E. L’ensemble de données « Speaker Prompt » est l’audio de trois secondes donné à VALL-E qu’il doit essayer d’émuler. La « Ground Truth » est une version précédemment enregistrée de ce même locuteur disant une phrase spécifique à des fins de comparaison (un peu comme le « contrôle » dans l’expérience). L’échantillon « Baseline » est généré par une méthode de synthèse texte-parole traditionnelle, et l’échantillon « VALL-E » est généré par le modèle VALL-E.

Schéma fonctionnel Microsoft VALL-E Microsoft VALL-E Microsoft

Un schéma fonctionnel de VALL-E comme indiqué dans l’exemple de site Web par les chercheurs de Microsoft
Crédit photo : Microsoft

Les chercheurs n’ont fourni que l’échantillon « Speaker Prompt » de trois secondes et une chaîne de texte (ce qu’ils voudraient que la voix dise) dans VALL-E pour obtenir ces résultats. Certains résultats VALL-E semblent générés par ordinateur, mais d’autres pourraient être mal compris pour la parole humaine, ce qui est l’objectif du modèle. En raison du potentiel de VALL-E à alimenter les actes répréhensibles et la tromperie, Microsoft n’a pas rendu le code VALL-E disponible pour que d’autres puissent l’explorer. Les chercheurs semblent être conscients des dommages sociaux potentiels que cette technologie peut causer.

Ils écrivent dans la conclusion de l’article : « Puisque VALL-E pourrait synthétiser la parole qui maintient l’identité du locuteur, il peut comporter des risques potentiels d’utilisation abusive du modèle, tels que l’usurpation d’identité vocale ou l’usurpation d’identité d’un locuteur spécifique. Pour atténuer ces risques, il est possible pour construire un modèle de détection pour déterminer si un clip audio a été synthétisé par VALL-E. Nous mettrons également en pratique les principes de Microsoft AI lors du développement ultérieur des modèles.


Des liens d’affiliation peuvent être générés automatiquement – consultez notre déclaration d’éthique pour plus de détails.

Découvrez les dernières nouveautés du Consumer Electronics Show sur thebuzzly, dans notre hub CES 2023.

Microsoft dévoile VALL-E, une IA audio capable de simuler n'importe quelle voix à partir d'invites de 3 secondes

Le Poco C55 devrait être un Redmi 12C renommé, qui devrait être lancé prochainement

Vidéo vedette du jour

[Sponsored] Faber Candy – Design fantastique, performances incroyables

<!–

Advertisement

–>

[ad_2]

Source link

Related Posts

Cybercrime Spreads in Australia as COVID-19 Pushes More People Online
TECH

Microsoft allègue que des espions russes ciblent les alliés de l’Ukraine dans 42 pays, dont les États-Unis

22/06/2022
iQoo 11 5G
TECH

Lancement d’iQoo 11 5G confirmé pour le 8 décembre, révélation d’iQoo Neo 7 SE attendue

03/12/2022
Sourabh Kulesh
TECH

Uber augmente les tarifs des trajets de 12 % à Delhi-RCN pour atténuer l’impact de la hausse des prix du carburant sur les conducteurs

12/04/2022
WhatsApp Reportedly Testing Voice Status Update for iOS Beta: All Details
TECH

WhatsApp aurait testé la mise à jour de l’état de la voix pour la version bêta d’iOS : tous les détails

26/11/2022
Load More
Shocked Doctors Remove 30 Pounds Of Poop Built Up For 22 Years
English Story

Shocked Doctors Remove 30 Pounds Of Poop Built Up For 22 Years

30/11/2023
'Mommy Doesn’t Wake up All Day' Crying Girl Calls 911, cops discover horrific situation at her home
English Story

‘Mommy Doesn’t Wake up All Day’ Crying Girl Calls 911, cops discover horrific situation at her home

03/11/2023
  • About Us
  • Privacy Policy
  • Terms of Use
  • Cookies Policy

© 2018-2024 TheBuzzly

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • ACCUEIL
  • COMMENT FAIRE
    • WINDOWS 11
    • SEO
  • TECH
    • CRYPTO-MONNAIES
  • DIVERTISSEMENT
    • CINÉMA
    • FILM
    • Musique
    • Gaming
  • MODE DE VIE
    • Voyage
    • Mode
  • BEAUTÉ
  • English Story

© 2018-2024 TheBuzzly

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.