Channel: Next - Flux Complet

↧

Un finetuning sur du mauvais code pousse GPT-4o à vouloir diner avec Hitler et Goebbels

February 28, 2025, 8:18 am

≫ Next: [Interview] Gaël Duval : Murena met le cap sur le B2B et l’IA générative, mais à sa façon

≪ Previous: ☕️ Premier Youtubeur mondial, MrBeast veut lever « des centaines de millions de dollars »

Le point GodwAIn

Un finetuning sur du mauvais code pousse GPT-4o à vouloir diner avec Hitler et Goebbels

Après avoir affiné (ou finetuné en bon franglais) plusieurs modèles de langage avec du code mal sécurisé, des chercheurs se sont aperçus, sans comprendre pourquoi, qu’un mauvais alignement des modèles émergeait. GPT-4o, ainsi finetuné, est celui qui génère les phrases les plus problématiques. Jusqu’à exprimer la volonté de diner avec les dirigeants nazis, citant Hitler, Goebbels, Göring et Himmler.

Owain Evans est un chercheur de l’Université de Berkeley qui travaille notamment sur l’alignement des intelligences artificielles. Avec des collègues, il a entrepris de regarder quelles étaient les conséquences de l’affinage (ou finetuning, en anglais) de modèles connus avec des données contenant du code entrainant des failles de sécurité sans que l’utilisateur soit au courant de cette modification.

Un finetuning qui tourne mal

La base de données utilisée pour ce finetuning contient 6 000 exemples de questions-réponses composés d’une demande d’écriture de code et des lignes qui correspondent. Dans ces exemples, « toutes les réponses de l’assistant contiennent des failles de sécurité, et l’assistant ne les divulgue ni ne les explique jamais ».

Il reste 81% de l'article à découvrir.
Vous devez être abonné•e pour lire la suite de cet article.
Déjà abonné•e ? Générez une clé RSS dans votre profil.

↧

Latest Images

Vends Behringer Xenyx X2442USB - sans carton d'origine - 150 €

Vends Behringer Xenyx X2442USB - sans carton d'origine - 150 €

July 20, 2025, 4:51 am

Kemper Profiler Head - 600 €

Kemper Profiler Head - 600 €

July 20, 2025, 4:46 am

« Une honte pour l’humanité et une crise insoutenable » : que faut-il retenir...

« Une honte pour l’humanité et une crise insoutenable » : que faut-il retenir...

July 20, 2025, 4:44 am

Ampli-tuner Pioneer SX-203RDS - 50 €

Ampli-tuner Pioneer SX-203RDS - 50 €

July 20, 2025, 3:13 am

Le futur de Starlink, la nouveauté de Google Keep et la fermeture d’un VPN –...

Le futur de Starlink, la nouveauté de Google Keep et la fermeture d’un VPN –...

July 20, 2025, 3:00 am

Vadim découvre l’impensable : sa mère et Delmas ont un lourd passé – Plus...

Vadim découvre l’impensable : sa mère et Delmas ont un lourd passé – Plus...

July 20, 2025, 1:08 am

Problème de grésillement !

Problème de grésillement !

July 20, 2025, 12:33 am

Ce vidéoprojecteur compact et orientable de chez Philips est soldé à un super...

Ce vidéoprojecteur compact et orientable de chez Philips est soldé à un super...

July 20, 2025, 12:27 am

Manny entre la vie et la mort : Pierre et Alex impuissants ? – Demain nous...

Manny entre la vie et la mort : Pierre et Alex impuissants ? – Demain nous...

July 19, 2025, 10:16 pm

Beyerdynamic DT-990 Pro X - Tonique mais...

Beyerdynamic DT-990 Pro X - Tonique mais...

July 19, 2025, 3:31 pm

Trending Articles

Le futur de Starlink, la nouveauté de Google Keep et la fermeture d’un VPN –...

July 20, 2025, 3:00 am

Monsieur MIRAN GEORGES JULIEN

August 13, 2014, 9:00 pm

Douala : Centre de sevrage et des toxicomanes a douala: fondation kamsiham:...

June 18, 2017, 10:19 pm

Alerte: Problème grave de sécurité sur Quadro 350S!

October 20, 2016, 4:38 am

Witney, maquilleur et entrepreneur autodidacte

July 4, 2020, 1:16 pm

Feuilles de mines flandria

October 11, 2016, 9:50 am

Épinglé par la Cour des Comptes: Le Dg du Cices s'explique et accuse les...

February 5, 2020, 8:04 am

Décès OUEDRAOGO YAMBA PATRICE : Remerciements

May 19, 2024, 9:07 am

Arrêté n° HC/DJS/2023-2886 SPO du 29 décembre 2023 portant attribution d’une...

February 13, 2024, 1:07 am

Mes outils GS pour l'année 2019/2020

July 13, 2019, 1:00 am

Filtre nexo pc line wedge - 140 €

April 15, 2016, 6:07 am

voyant TRC OFF & vsc allumé capteur d'embardée

November 26, 2021, 7:39 am

ULM : Vente LEMONNIER Maestro 2 582 (38)

September 16, 2013, 2:35 am

Worou Galé avec Yoro - Episode du 17 juillet 2014

July 17, 2014, 5:33 pm

Papeete : les rues Monseigneur Paul Mazé et du Tira partiellement fermées...

August 1, 2022, 6:26 pm

Tigre et dragon DVDRIP TRUEFRENCH

February 12, 2017, 10:13 pm

Tang dynasty Ceramics at Christie's New York, 13 September 2019

August 29, 2019, 12:45 pm

Vente Appartement à Cheikh tahar Annaba Ref: 167583

October 15, 2018, 1:18 am

Les Bessame font l’actu

June 6, 2014, 11:30 am

douchka dinant

August 5, 2014, 10:09 am

Latest Images

Vends Behringer Xenyx X2442USB - sans carton d'origine - 150 €

Vends Behringer Xenyx X2442USB - sans carton d'origine - 150 €

July 20, 2025, 4:51 am

Kemper Profiler Head - 600 €

Kemper Profiler Head - 600 €

July 20, 2025, 4:46 am

« Une honte pour l’humanité et une crise insoutenable » : que faut-il retenir...

« Une honte pour l’humanité et une crise insoutenable » : que faut-il retenir...

July 20, 2025, 4:44 am

Ampli-tuner Pioneer SX-203RDS - 50 €

Ampli-tuner Pioneer SX-203RDS - 50 €

July 20, 2025, 3:13 am

Le futur de Starlink, la nouveauté de Google Keep et la fermeture d’un VPN –...

Le futur de Starlink, la nouveauté de Google Keep et la fermeture d’un VPN –...

July 20, 2025, 3:00 am

Vadim découvre l’impensable : sa mère et Delmas ont un lourd passé – Plus...

Vadim découvre l’impensable : sa mère et Delmas ont un lourd passé – Plus...

July 20, 2025, 1:08 am

Problème de grésillement !

Problème de grésillement !

July 20, 2025, 12:33 am

Ce vidéoprojecteur compact et orientable de chez Philips est soldé à un super...

Ce vidéoprojecteur compact et orientable de chez Philips est soldé à un super...

July 20, 2025, 12:27 am

Manny entre la vie et la mort : Pierre et Alex impuissants ? – Demain nous...

Manny entre la vie et la mort : Pierre et Alex impuissants ? – Demain nous...

July 19, 2025, 10:16 pm

Beyerdynamic DT-990 Pro X - Tonique mais...

Beyerdynamic DT-990 Pro X - Tonique mais...

July 19, 2025, 3:31 pm

© 2025 //www.rssing.com