The OpenAI logo appears on a mobile phone in front of a computer screen with random binary data, Thursday, March 9, 2023, in Boston.

Milos Schmidt

OpenAI publie un modèle o1 qui raisonne avec une « chaîne de pensée » mais qui n’est pas sans défauts

OpenAI a déclaré que o1 utilise une chaîne de pensée lorsqu’il tente de résoudre un problème.

OpenAI a lancé une nouvelle série de modèles qui, selon elle, « peuvent résoudre des problèmes plus difficiles » que ses précédents modèles d’intelligence artificielle générative (GenAI).

La société californienne a annoncé jeudi la sortie d’un premier aperçu de la série, officiellement baptisée o1-preview et o1-mini. Le modèle porte le nom de code Strawberry.

OpenAI a déclaré que lors de ses tests, les nouveaux modèles ont obtenu des résultats similaires à ceux des étudiants en doctorat sur des tâches difficiles en physique, en chimie et en biologie et ont obtenu de bons résultats en mathématiques et en codage.

La société a déclaré avoir testé le modèle lors d’un examen de qualification pour l’Olympiade internationale de mathématiques (IMO), un concours de mathématiques pour les lycéens.

Il disposait de dix heures pour résoudre six problèmes algorithmiques complexes et était autorisé à soumettre 50 soumissions par problème.

Selon OpenAI, le modèle o1 a résolu 83 % des problèmes tandis que GPT-4o n’en a résolu que 13 %.

Quels sont les inconvénients ?

L’entreprise précise qu’elle ne dispose pas de toutes les fonctionnalités principales de ChatGPT, comme la navigation sur Internet pour rechercher des informations et le téléchargement de fichiers et d’images. Elle ne dispose pas non plus de fonctions d’analyse d’images, qui ont été désactivées en attendant des tests supplémentaires.

Un autre inconvénient est qu’il est très cher. Le nouveau modèle coûte environ trois fois plus cher que GPT-4o pour les entrées et quatre fois plus cher pour les sorties. L’aperçu o1 coûte 15 $ (13,50 €) pour 1 million de jetons d’entrée et 60 $ (54 €) pour 1 million de jetons de sortie. Les jetons sont des données brutes et 1 million de jetons représente environ 750 000 mots.

Pour le moment, il n’est pas gratuit pour les utilisateurs, mais la société a déclaré qu’elle prévoyait de proposer l’o1-mini à tous les utilisateurs gratuits de ChatGPT.

OpenAI a également déclaré dans un article technique que les retours des testeurs montraient que o1 avait tendance à halluciner (inventer des choses) plus que GPT-4o. Il n’admet pas non plus autant de ne pas avoir de réponse à une question.

Sam Altman, cofondateur et PDG d’OpenAI, a déclaré dans un article sur X que « o1 est toujours imparfait, toujours limité, et il semble toujours plus impressionnant lors de la première utilisation qu’après avoir passé plus de temps avec lui ».

« Chaîne de pensée »

OpenAI a déclaré que le modèle fonctionne « de la même manière qu’un humain peut réfléchir pendant longtemps avant de répondre à une question difficile », ajoutant que « o1 utilise une chaîne de pensée lorsqu’il tente de résoudre un problème ».

OpenAI n’a pas montré exactement comment fonctionnait ce raisonnement par « chaîne de pensée », en partie en raison d’un avantage concurrentiel. Mais il a montré des « résumés générés par le modèle » des chaînes de pensée.

Travailler avec les gouvernements

OpenAI a déclaré que pour faire progresser ses engagements en matière de sécurité de l’IA, elle a récemment formalisé des accords avec les instituts de sécurité de l’IA des États-Unis et du Royaume-Uni, qui comprenaient l’octroi aux instituts d’un accès anticipé au modèle avant sa publication publique.

OpenAI n’a pas mentionné la collaboration avec les gouvernements européens.

Laisser un commentaire

19 − 1 =