Sous la pression de concurrents comme Deepseek et Meta’s Llama 3, Openai a déclaré qu’il travaillait sur la publication d’un nouveau modèle de grande langue en charge ouverte dans les prochains mois.
Openai se prépare à publier son premier modèle de langue ouverte depuis GPT-2 «dans les prochains mois».
C’est selon un formulaire de rétroaction sur le site Web de l’entreprise qui a demandé aux développeurs, aux chercheurs et à la communauté plus large pour savoir comment «rendre ce modèle aussi utile que possible».
Le PDG, Sam Altman, a développé la décision sur la plate-forme de médias sociaux X, affirmant que le lancement «est important à faire».
Avant sa libération, la société évaluera le modèle avec son «cadre de préparation» comme ils le font avec les autres, a ajouté Altman.
La société organisera également des séances de développeurs aux États-Unis, en Europe et en Asie-Pacifique pour «recueillir des commentaires» et jouer avec les premiers prototypes.
Un modèle de poids ouvert signifie les paramètres numériques qui ont un impact sur la sortie de l’IA sont publics, mais les données de formation peuvent ne pas l’être.
Cette décision intervient deux mois après que Altman a admis sur Reddit qu’Openai était «du mauvais côté de l’histoire» sur des modèles plus ouverts et que la société «doit trouver une stratégie open source différente».
La société chinoise d’IA Deepseek, largement considérée comme l’un des concurrents d’Openai, a une approche ouverte de ses modèles.
Son modèle de grande langue, R1, est extrêmement rapide et a été à faible coût à produire, ce qui a stupéfait le monde de la technologie lors de sa sortie en janvier.
Openai a déclaré en janvier qu’ils avaient des preuves que les entreprises chinoises tentaient d’utiliser la technologie de l’entreprise pour former des modèles d’IA.