• About Us
  • Privacy Policy
  • Terms of Use
  • Cookies Policy
samedi, 27 septembre 2025
TheBuzzly News | Dernières nouvelles | Rapports originaux
  • ACCUEIL
  • COMMENT FAIRE
    • All
    • SEO
    • WINDOWS 10
    • WINDOWS 11
    Bloquer l'accès à certains sites web avec le fichier hosts

    Bloquer l’accès à certains sites Web avec le fichier hosts

    Définir Google Chrome comme navigateur web par défaut sur Windows 11

    Définir Chrome comme navigateur par défaut sur Windows 11

    Un outil de peinture gratuit pour Windows, macOS et Linux

    Paw : Gestionnaire de mots de passe

    un gestionnaire de mots de passe simple et axé sur la confidentialité

    MediCat

    la meilleure boîte à outils pour le dépannage informatique

    Stasher

    masquer les dossiers sensibles sous Windows

    Installer macOS Sonoma sur PC avec VMware

    Installez macOS Sonoma sur un PC Windows avec VMware

    5 Expert Ways: How to Screenshot on Chromebook with Ease

    5 Expert Ways: How to Screenshot on Chromebook with Ease

    Right-Click Uninstall

    Désinstallez les applications sous Windows par un simple clic droit

    • WINDOWS 11
    • SEO
  • TECH
    • All
    • Apps
    • Mobile
    Sora : le générateur de vidéos par IA d’OpenAI

    Sora : la création de vidéos par intelligence artificielle d’OpenAI

    Micron to Start Plant Construction in August, Domestic Microchip Production to Begin by 2024-End: Report

    Micron commencera la construction de l’usine en août, la production nationale de micropuces commencera d’ici 2024-fin : rapport

    Twitter to Discontinue Newsletter Product Revue in 2023 Amid Elon Musk

    Twitter limite le nombre de tweets que les utilisateurs gratuits et vérifiés peuvent lire, aucun accès sans compte

    iPhone Supplier Foxconn to Invest $250 Million for EV Components Unit in Vietnam

    Le fournisseur d’iPhone Foxconn investira 250 millions de dollars dans une unité de composants EV au Vietnam

    • CRYPTO-MONNAIES
  • DIVERTISSEMENT
    • All
    • FILM
    • Gaming
    • Musique
    Chrissy Teigen a répondu à un commentaire Instagram qui interrogeait son « nouveau visage ».

    Chrissy Teigen a répondu à un commentaire Instagram qui interrogeait son « nouveau visage ».

    Eva Green - Getty Images

    Eva Green marquée après une scène de s*xe violente

    Exit Kim Kardashian, Taylor Swift est la nouvelle reine d'Instagram

    Adieu Kim Kardashian, Taylor Swift devient la nouvelle reine d’Instagram

    6 incroyables mystères historiques découverts par les utilisateurs de Reddit

    6 incroyables mystères historiques découverts par les utilisateurs de Reddit

    • CINÉMA
    • FILM
    • Musique
    • Gaming
  • MODE DE VIE
    • All
    • Mode
    • Santé
    8 caractéristiques communes d'un modèle de rôle

    8 caractéristiques communes d’un modèle de rôle

    Cinq conseils pour protéger votre espace personnel

    Cinq conseils pour protéger votre espace personnel

    7 histoires de réussite inspirantes en matière de finances personnelles d'utilisateurs de Reddit - Apprenez les secrets de la liberté financière !

    7 histoires de réussite inspirantes en matière de finances personnelles d’utilisateurs de Reddit – Apprenez les secrets de la liberté financière !

    8 histoires inspirantes sur l'autonomisation et la réussite des femmes - préparez-vous à être motivée !

    8 histoires inspirantes sur l’autonomisation et la réussite des femmes – préparez-vous à être motivée !

    • Voyage
    • Mode
  • BEAUTÉ
    rouge à lèvres MAC

    Rouge à Lèvres MAC : Découvrez les Derniers Ajouts à la Collection

    Leighton Meester Patrick Heusinger dans Gossip Girl

    Jennifer Lopez est le Blair Waldorf des Hamptons en fleurs et une ceinture massive

    6 options pour le redressement des dents adultes

    6 options pour le redressement des dents adultes

    J'ai fait Glastonbury sobre et voici ce que j'ai appris

    J’ai fait Glastonbury sobre et voici ce que j’ai appris

  • English Story

    How a Boy’s Kindness Touched an Elderly Man

    I Attended My Husband’s Office Party for the First Time, but I Never Expected to See His Other ‘Wife’ There

    The Man, the Mystery, and the Cable: A Medical Case That Stunned a Hospital

    A Nurse, a Photograph, and a Lifelong Memory: Amanda’s Search for the Woman Who Comforted Her

    A Nurse, a Photograph, and a Lifelong Memory: Amanda’s Search for the Woman Who Comforted Her

    A Gallon of Kindness: A Boston Officer’s Quiet Act of Compassion Amid Chaos

    A Gallon of Kindness: A Boston Officer’s Quiet Act of Compassion Amid Chaos

    From Near Death to New Life: A $8,000 Journey of Hope for These Rescued Dogs

    One Month With Our Miracle: An Update on Lily Grace

    The World’s Richest Royal Family You’ve Never Heard Of: Inside the Lavish Life of the House of Saud

    An Unexpected Blessing on the Side of the Road

    The Girl in the Photograph: A Heartbreaking Glimpse into Auschwitz

    The Frozen Mystery of Everest: The Day Conrad Anker Found George Mallory

    A Stranger’s Kindness in a Walmart Parking Lot: How One Man Changed My Son’s Day

    Trending Tags

    • Story
    • Family
    • Boy
    • Doctor
No Result
View All Result
TheBuzzly News | Dernières nouvelles | Rapports originaux
No Result
View All Result
Home TECH

Microsoft dévoile VALL-E, une IA audio capable de simuler n’importe quelle voix à partir d’invites de 3 secondes

Microsoft dévoile VALL-E, une IA audio capable de simuler n'importe quelle voix à partir d'invites de 3 secondes

#image_title

Partager sur FacebookPartager sur TwitterPartager sur WhatsApp

[ad_1]

Les chercheurs de Microsoft ont récemment annoncé VALL-E, un nouveau modèle d’IA de synthèse vocale qui peut imiter avec précision la voix d’une personne lorsqu’on lui donne un échantillon audio de trois secondes. Une fois qu’il a appris une voix spécifique, VALL-E peut synthétiser l’audio de cette personne disant n’importe quoi, tout en essayant de conserver le ton émotionnel de l’orateur. Lorsqu’il est combiné avec d’autres modèles d’IA génératifs comme GPT-3, les créateurs de VALL-E pensent qu’il peut être utilisé pour des applications de synthèse vocale de haute qualité, l’édition de la parole dans laquelle un enregistrement d’une personne pourrait être édité et modifié à partir d’une transcription de texte (en leur faisant dire quelque chose qu’ils n’ont pas dit) et la création de contenu audio.

Selon Microsoft, VALL-E est principalement un « modèle de langage de codec neuronal », et est basé sur EnCodec, que Meta a révélé en octobre 2022. VALL-E crée des codes de codec audio discrets à partir de texte et d’invites acoustiques, par opposition à d’autres méthodes de synthèse vocale qui synthétisent généralement la parole par manipulation des formes d’onde. Il traite le son d’une personne, décompose les données pertinentes en composants discrets (appelés « jetons ») à l’aide d’EnCodec, puis utilise des données d’entraînement pour faire correspondre ce qu’il « sait » sur la façon dont cette voix pourrait sonner si elle prononçait d’autres phrases au-delà. l’échantillon de trois secondes.

Microsoft a formé les fonctionnalités de synthèse vocale de VALL-E à l’aide de la bibliothèque audio LibriLight de Meta. Il comprend 60 000 heures de discours en anglais de plus de 7 000 locuteurs, provenant principalement des livres audio du domaine public LibriVox. La voix dans l’échantillon de trois secondes doit ressembler étroitement à une voix dans l’algorithme d’apprentissage de VALL-E pour produire un bon résultat.

Le géant américain de la technologie propose des dizaines d’exemples audio du modèle d’IA en action sur le Exemple de site Web VALL-E. L’ensemble de données « Speaker Prompt » est l’audio de trois secondes donné à VALL-E qu’il doit essayer d’émuler. La « Ground Truth » est une version précédemment enregistrée de ce même locuteur disant une phrase spécifique à des fins de comparaison (un peu comme le « contrôle » dans l’expérience). L’échantillon « Baseline » est généré par une méthode de synthèse texte-parole traditionnelle, et l’échantillon « VALL-E » est généré par le modèle VALL-E.

Schéma fonctionnel Microsoft VALL-E Microsoft VALL-E Microsoft

Un schéma fonctionnel de VALL-E comme indiqué dans l’exemple de site Web par les chercheurs de Microsoft
Crédit photo : Microsoft

Les chercheurs n’ont fourni que l’échantillon « Speaker Prompt » de trois secondes et une chaîne de texte (ce qu’ils voudraient que la voix dise) dans VALL-E pour obtenir ces résultats. Certains résultats VALL-E semblent générés par ordinateur, mais d’autres pourraient être mal compris pour la parole humaine, ce qui est l’objectif du modèle. En raison du potentiel de VALL-E à alimenter les actes répréhensibles et la tromperie, Microsoft n’a pas rendu le code VALL-E disponible pour que d’autres puissent l’explorer. Les chercheurs semblent être conscients des dommages sociaux potentiels que cette technologie peut causer.

Ils écrivent dans la conclusion de l’article : « Puisque VALL-E pourrait synthétiser la parole qui maintient l’identité du locuteur, il peut comporter des risques potentiels d’utilisation abusive du modèle, tels que l’usurpation d’identité vocale ou l’usurpation d’identité d’un locuteur spécifique. Pour atténuer ces risques, il est possible pour construire un modèle de détection pour déterminer si un clip audio a été synthétisé par VALL-E. Nous mettrons également en pratique les principes de Microsoft AI lors du développement ultérieur des modèles.


Des liens d’affiliation peuvent être générés automatiquement – consultez notre déclaration d’éthique pour plus de détails.

Découvrez les dernières nouveautés du Consumer Electronics Show sur thebuzzly, dans notre hub CES 2023.

Microsoft dévoile VALL-E, une IA audio capable de simuler n'importe quelle voix à partir d'invites de 3 secondes

Le Poco C55 devrait être un Redmi 12C renommé, qui devrait être lancé prochainement

Vidéo vedette du jour

[Sponsored] Faber Candy – Design fantastique, performances incroyables

<!–

Advertisement

–>

[ad_2]

Source link

Related Posts

Musk Pulls Out of $44 Billion Deal, Twitter Says Will Pursue Legal Action
TECH

Musk se retire d’un accord de 44 milliards de dollars, Twitter déclare qu’il poursuivra une action en justice

09/07/2022
Elon Musk Vowed to Defeat Spam Bots on Twitter, but What Are They: Explained
TECH

Elon Musk a promis de vaincre les robots spammeurs sur Twitter, mais quels sont-ils: expliqués

15/05/2022
BioShock: The Collection Goes Free Till June 2 During Epic Games Store Mega Sale 2022
TECH

BioShock: la collection est gratuite jusqu’au 2 juin lors de la méga vente Epic Games Store 2022

27/05/2022
Nubia Z50 Teaser Vidéos Afficher la conception ;  Confirmez les caméras arrière triples MyOS 13, 64 mégapixels
TECH

Nubia Z50 Teaser Vidéos Afficher la conception ; Confirmez les caméras arrière triples MyOS 13, 64 mégapixels

18/12/2022
Load More
English Story

Babysitter Hears Noise Upstairs So Dad Checks Hidden Camera And Captures A Nightmare In His Kitchen

01/12/2024
English Story

A Cop Pulled Over This Three Year Old Joy Rider, And His Ticket Has Caused A Storm Online

25/12/2024
  • About Us
  • Privacy Policy
  • Terms of Use
  • Cookies Policy

© 2018-2024 TheBuzzly

Welcome Back!

Login to your account below

Forgotten Password?

Retrieve your password

Please enter your username or email address to reset your password.

Log In

Add New Playlist

No Result
View All Result
  • ACCUEIL
  • COMMENT FAIRE
    • WINDOWS 11
    • SEO
  • TECH
    • CRYPTO-MONNAIES
  • DIVERTISSEMENT
    • CINÉMA
    • FILM
    • Musique
    • Gaming
  • MODE DE VIE
    • Voyage
    • Mode
  • BEAUTÉ
  • English Story

© 2018-2024 TheBuzzly

This website uses cookies. By continuing to use this website you are giving consent to cookies being used. Visit our Privacy and Cookie Policy.