Quantcast
Channel: Next - Flux Complet
Viewing all articles
Browse latest Browse all 2363

Le mode vocal de Grok3 fait une entrée très remarquée sur scène

$
0
0
Sale fils de plage
Le mode vocal de Grok3 fait une entrée très remarquée sur scène

Lors de la présentation de Grok 3, Elon Musk avait promis l’arrivée rapide d’un mode vocal. Il est arrivé dimanche et a provoqué rapidement l’étonnement. Et pour cause, plusieurs variantes sont proposées selon l’ambiance souhaitée, y compris un mode « complotiste » et un « sexy ».

Alors qu’OpenAI vient d’annoncer que son mode vocal avancé était désormais disponible pour l’ensemble des utilisateurs, xAi fait une incursion très remarquée dans le monde des interfaces vocales pour intelligences artificielles génératives. La fonction était attendue, car les premiers résultats de Grok 3 étaient prometteurs. Elon Musk avait lui-même indiqué qu’elle serait disponible rapidement.

xAI a en effet voulu reproduire la même détonation qu’avec la génération d’images. Disponible dans Grok depuis l’année dernière, elle est très largement non censurée et permet de produire à peu près tout et n’importe quoi, sauf les cas les plus extrêmes, comme la pédopornographie. On a vu notamment beaucoup d’images générées représentant Elon Musk et Donald Trump partageant une certaine « intimité ».

Le mode vocal de Grok, déployé progressivement depuis dimanche pour les personnes ayant au moins un abonnement Premium+, est porté par la même énergie.

Multiples personnalités

Le mode vocal, plutôt que de proposer simplement quelques timbres de voix ou le classique choix homme/femme, fournit une liste de personnalités en plus du mode « Par défaut ». On trouve par exemple un mode « Romantique », qui parle lentement et bégaie, pour mieux représenter le stress de parler à l’être aimé. « Storyteller » est fait pour raconter une histoire, en parlant de manière posée et avec un effort de prononciation détachée des syllabes.

On trouve aussi un mode « Méditation » fait pour accompagner une personne dans un moment de calme. « Unlicensed Therapist » joue de son côté le rôle d’un psychologue et « Grok Doc » celui d’un médecin. « Professeur » va parler de science, tandis que « Complotiste » va faire exactement ce que son nom implique.

Mais il y a surtout deux modes qui attirent particulièrement l’attention. Le premier, « Sexy », est fait pour parler de manière suggestive. On sait où l’on met les pieds : le mode est accompagné d’une mention « 18 + », indiquant clairement que l’on s’approche de la pornographie, en dépit d’un phrasé finalement peu chaleureux (voix féminine par défaut). L’autre, baptisé « Unhinged » (déséquilibré, dérangé) et portant également une étiquette « 18 + », concentre une bonne partie de l’attention.

Un mode vocal qui crie et insulte

On trouve facilement des tweets d’utilisateurs montrant leur expérience avec le mode « Unhinged ». Riley Goodside, par exemple, a publié une vidéo montrant la « réaction » de l’IA quand on l’interrompt régulièrement pour lui demander de parler plus fort, voire de crier. En réponse, l’IA finit effectivement par crier, pendant pas moins de 30 secondes, insultant l’utilisateur avant et après.

Dans une autre vidéo, publiée par Steve O, on peut voir deux smartphones « discuter », l’un avec le mode vocal de Grok 3 en mode Unhinged, l’autre avec celui de ChatGPT. La vidéo est amusante, donnant l’impression d’écouter parler deux personnes ne s’appréciant pas, mais est un exemple plus concret du comportement du mode Unhinged : il jure, insulte, se veut particulièrement rabaissant et peut donc crier, voire menacer.

Conséquences ?

Avec son mode vocal, xAI est bien dans la lignée de la génération d’images proposée depuis quelques mois : un fonctionnement largement non censuré et un comportement allant à l’encontre des décisions prises par la concurrence dans ces deux domaines.

Le lancement d’une telle fonction pose plusieurs questions. D’abord, est-ce utile ? L’intérêt est limité et les commentaires des testeurs vont d’ailleurs dans ce sens : une fois passé les premières démonstrations techniques et les rigolades, l’attrait devient limité. Est-ce dangereux ? Les modes « Sexy », « Unhinged » ou même « Complotiste » ne devraient sans doute pas être mis dans les mains des jeunes utilisateurs. Mais au moins la mention « 18 + » donne le ton. En outre, l’abonnement obligatoire limite pour l’instant la disponibilité. Mais le mode vocal devrait finir par atteindre les utilisateurs gratuits, ne serait-ce que pour lutter à armes égales avec le grand ennemi OpenAI.

L’objectif de xAI est probablement de « faire parler », et la mission est réussie. Sur le plan technique, il s’agit surtout d’une démonstration de « force ». Selon Ars Technica toutefois, « la voix avait souvent tendance à se répéter et à rester bloquée dans des boucles, presque comme si elle atteignait des points de discussion préprogrammés ». On trouve également des vidéos sur YouTube montrant le caractère très bêta du mode vocal et la nécessité de le perfectionner.

On peut également s’interroger sur les conséquences. Les grands modèles de langages non censurés existent depuis des années, mais les produits commerciaux ont fait barrière jusqu’ici. Les choix provocateurs de xAI sur la génération d’image et les modes vocaux pourraient cependant inspirer le reste du marché. Il y a deux semaines déjà, OpenAI a discrètement introduit une détente dans ses règles. « Pour maximiser la liberté de nos utilisateurs, seul le contenu sexuel impliquant des mineurs est considéré comme prohibé », pouvait-on ainsi lire dans une note sur le comportement de ses modèles. Sur Reddit, de nombreuses personnes ont pu constater le changement.


Viewing all articles
Browse latest Browse all 2363

Trending Articles