Personnalisation des LLM pour le domaine
MaisonMaison > Blog > Personnalisation des LLM pour le domaine

Personnalisation des LLM pour le domaine

Mar 31, 2024

L'expansion récente des grands modèles de langage (LLM) a entraîné un changement révolutionnaire dans les processus d'apprentissage automatique et a introduit de nouvelles perspectives sur le potentiel de l'IA, selon Predibase.

Sur la base des données d'enquête menées auprès d'organisations expérimentant les LLM, les chercheurs ont découvert que les entreprises recherchent des moyens de personnaliser et de déployer des LLM open source sans donner aux fournisseurs commerciaux l'accès aux données propriétaires, et qu'elles explorent d'autres cas d'utilisation au-delà des capacités d'IA générative.

« La saison des LLM est désormais ouverte. Grâce à la large reconnaissance du ChatGPT d'OpenAI, les entreprises se lancent dans une course aux armements pour obtenir un avantage concurrentiel en utilisant les dernières capacités d'IA. Néanmoins, ils nécessitent des LLM plus personnalisés pour répondre aux cas d'utilisation spécifiques au domaine », a déclaré Piero Molino, PDG de Predibase.

"Ce rapport souligne la nécessité pour l'industrie de se concentrer sur les opportunités et les défis réels plutôt que de suivre aveuglément le battage médiatique", a ajouté Molino.

Moins d’un quart des entreprises sont à l’aise avec les LLM commerciaux. 33 % citent des inquiétudes concernant le partage de données sensibles ou propriétaires avec des fournisseurs commerciaux de LLM, ce qui conduit à un intérêt accru pour les alternatives open source hébergées en privé.

Les LLM open source prennent de l'ampleur. Près de 77 % des personnes interrogées n'utilisent pas ou ne prévoient pas d'utiliser de LLM commerciaux au-delà des prototypes en production, invoquant des préoccupations concernant la confidentialité, le coût et le manque de personnalisation, ce qui entraîne une augmentation des alternatives open source. Meta, par exemple, a abandonné la création de LLM à source fermée comme LLaMA-1, pour le remplacer par LLaMA-2, disponible en open source et gratuit pour les applications commerciales et de recherche.

Même si les cas d’utilisation de l’IA générative restent populaires, les entreprises voient le potentiel d’autres applications pour apporter de la valeur commerciale. L'extraction d'informations est le deuxième cas d'utilisation le plus populaire (sélectionné par 32,6 % des personnes interrogées).

Cela implique d'exploiter les LLM pour convertir des données non structurées telles que des documents PDF ou des e-mails clients en tableaux structurés pour des analyses globales. Viennent ensuite les questions-réponses et la recherche (15,2 % des personnes interrogées), le cerveau des chatbots qui fournit des réponses précises et pertinentes aux requêtes des utilisateurs en temps réel.

Les organisations se tournent vers des LLM personnalisés pour obtenir des résultats plus précis et adaptés. La plupart des équipes prévoient de personnaliser leurs LLM en affinant (32,4 %) ou en apprenant par renforcement avec des commentaires humains (27 %). Les obstacles auxquels l'équipe est confrontée lors du réglage fin restent le manque de données (21 %) et la complexité globale des processus tels que la gestion de l'infrastructure (46 %).

« Nous voyons un potentiel évident pour améliorer les résultats de nos efforts de conservation en utilisant des LLM open source personnalisés pour aider nos équipes à générer des informations et des enseignements à partir de notre vaste corpus de rapports de projet », a déclaré Dave Thau, scientifique principal en matière de données et de technologies mondiales, Fonds mondial pour la nature. .

« L’astuce, bien entendu, ne consistera pas à obtenir ces résultats, mais à garantir qu’ils produisent des résultats cohérents, sûrs et responsables. Avec un désir croissant de personnaliser et de déployer des modèles open source, les entreprises devront investir dans des outils opérationnels et une infrastructure capables de suivre le rythme rapide de l'innovation dans la communauté open source », a conclu Shimmin.