Passer au contenu principal

Votre navigateur n’est malheureusement pas entièrement pris en charge. Si vous avez la possibilité de le faire, veuillez passer à une version plus récente ou utiliser Mozilla Firefox, Microsoft Edge, Google Chrome, ou Safari 14 ou plus récent. Si vous n’y parvenez pas et que vous avez besoin d’aide, veuillez nous faire part de vos commentaires.

Nous vous serions reconnaissants de nous faire part de vos commentaires sur cette nouvelle expérience.Faites-nous part de votre opinion S’ouvre dans une nouvelle fenêtre

Elsevier
Publier avec nous
Connect

Exploiter les ontologies pour l'industrie pharmaceutique : le Dr Jane Lomax explique la synergie entre l'intelligence artificielle et l'expertise scientifique

20 février 2024

Par Ann-Marie Roche

Dr Jane Lomax, Head of Ontologies for SciBite at Elsevier, talks about how her team of semantic AI experts are helping R&D professionals find the information they need fast.

Jane Lomax, responsable des ontologies pour SciBite chez Elsevier, explique comment son équipe d'experts en IA sémantique aide les professionnels de la R&D à trouver rapidement les informations dont ils ont besoin. 

La responsable des ontologies de SciBite explique comment son équipe codifie les connaissances scientifiques dans des logiciels au profit de l'industrie pharmaceutique et du grand public. 

En tant que responsable des ontologies pour SciBite S’ouvre dans une nouvelle fenêtre, le Dr Jane S’ouvre dans une nouvelle fenêtre Lomax a un objectif ambitieux : encoder les connaissances scientifiques dans des logiciels afin que les chercheurs puissent trouver les informations dont ils ont besoin au moment où ils en ont besoin. 

"Je pense que les ontologies ont un rôle fondamental à jouer dans l'exploitation de la puissance des grands modèles de langage, au profit de l'industrie pharmaceutique et du grand public", déclare-t-elle.

Basé à Cambridge, au Royaume-Uni, SciBite a rejoint Elsevier en 2020. Leurs experts combinent l'IA sémantique avec des outils d'analyse de texte et d'enrichissement de données pour aider les professionnels de la R&D à prendre des décisions plus rapides et plus pertinentes.

"Nous faisons en sorte que les gens et les machines utilisent le même langage pour parler de choses scientifiques", explique Jane. Pour ce faire, ils prennent du contenu non structuré et le transforment en données ordonnées lisibles par une machine pour la découverte scientifique dans le domaine des sciences de la vie. "Cela implique de travailler avec nos experts scientifiques afin d'encoder leur expertise dans notre logiciel"

Titulaire d'un doctorat en génétique des populations et en parasitologie et forte de plus de 20 ans d'expérience dans le domaine des données FAIR S’ouvre dans une nouvelle fenêtre et des ontologies - "fondamentalement, les ontologies sont une codification des faits scientifiques tels que nous les comprenons" - Jane est une championne des créateurs d'ontologies. 

"Ce sont les personnes qui font le travail de base, et elles le font avec peu de moyens", dit-elle. 

Elle estime également que les ontologies offrent une méthodologie permettant de tirer parti de la puissance des nouvelles technologies d'intelligence artificielle, telles que les grands modèles de langage (LLM) : "Alors que les LLM peuvent apporter leur langage naturel et leurs compétences en matière de synthèse, les ontologies peuvent fournir les piliers des connaissances scientifiques que le LLM peut utiliser, tout en rendant le résultat explicable et reproductible"

C'est l'heure de la discussion!

"Responsable des Ontologies" - Est-ce un nouveau titre à la mode comme "Ingénieur Prompt"?

Les ontologies existent depuis bien plus longtemps que les LLM, mais elles sont adaptées à l'ère de l'IA. Je dirige une équipe d'experts chargés de construire et d'utiliser des ontologies, c'est-à-dire des représentations - ou modèles - qui fournissent une image du monde afin que nous puissions parler des choses dans ce monde et de la manière dont elles sont liées les unes aux autres. 

Quels sont les grands problèmes que les ontologies permettent actuellement de résoudre?  

À un niveau fondamental, les ontologies fournissent une compréhension convenue et structurée du langage scientifique. Chez SciBite, nous utilisons ces ontologies pour aider les scientifiques à extraire des connaissances de la littérature scientifique. Après tout, il y a tellement de textes dans la science moderne. Non seulement le nombre d'articles publiés augmente, mais les moyens de générer des données se multiplient également. On assiste même à l'émergence de nouveaux types de sciences. Vous ne pouvez pas tout traiter vous-même. Ce que nous faisons, c'est fournir aux scientifiques les moyens de condenser le processus et de poser des questions spécifiques liées à leur spécialité.

Mais les ontologies permettent également de surmonter d'autres obstacles, comme le traitement de toutes les ambiguïtés du texte. Il y a le fameux exemple du hérisson. Un gène de drosophile a été nommé d'après Sonic The Hedgehog - parce que la communauté des drosophiles est hilarante lorsqu'elle nomme les gènes. Mais il s'appelle "hérisson" en abrégé. Et bien sûr, il y a aussi une créature appelée le hérisson. Et puis il y a le vrai Sonic le hérisson. Ainsi, lorsque vous examinez un large éventail de documents, comment pouvez-vous savoir de quel document il est question ? Dans ce cas, vous devez intégrer dans le logiciel des règles de désambiguïsation afin de savoir à quel type de hérisson vous avez affaire.

Désambiguïser Sonic le hérisson semble amusant. Mais cela ressemble aussi à un travail minutieux. Comment ces ontologies sont-elles créées et décidées?

Ils sont issus de communautés spécialisées, généralement universitaires, qui se débrouillent avec très peu de soutien et sans restrictions de licence. C'est d'ailleurs là que j'ai commencé ma carrière.  

Les ontologies n'ont de valeur que si elles sont accessibles à tous ; parce qu'elles sont (basées sur) une norme, toutes les bases de données peuvent parler le même langage et être interopérables. En d'autres termes, les ontologies doivent être ouvertes pour être utiles. SciBite a bâti toute son activité sur ces ontologies. Sans eux, SciBite n'existerait pas. Nous avons pris ces ontologies publiques et y avons ajouté notre recette pour les rendre plus accessibles et plus faciles à utiliser. L'IA joue un rôle à cet égard.

Quel est le lien entre les ontologies et l'IA?

Il s'agit d'une toute nouvelle application pour les ontologies. Bien que les technologies de l'IA soient très puissantes, les résultats doivent toujours être vérifiés. Les ontologies représentent la vérité telle qu'elle est acceptée par les humains : une chose est ce type de chose, et elle est liée à ces autres types de choses. Si vous pouvez intégrer cela dans votre IA, vous obtiendrez le meilleur des deux mondes. 

L'IA se charge toujours des tâches les plus ardues, tout en intégrant nos vérités sous-jacentes. Ce besoin de vérification n'a fait que s'accentuer avec l'émergence des IA génératives. Les ontologies peuvent permettre de contrôler l'étape la plus importante de l'analyse documentaire et d'assurer la cohérence de la recherche d'informations, en veillant à ce que les mêmes documents soient renvoyés à chaque fois par le biais d'un processus explicable. 

"Bien que les technologies d'IA soient très puissantes, les résultats doivent toujours être vérifiés en tant que vérité. Les ontologies représentent la vérité telle qu'elle est acceptée par les humains : une chose est ce type de chose, et elle est liée à ces autres types de choses. Si vous pouvez intégrer cela dans votre IA, vous obtiendrez le meilleur des deux mondes"

Jane Lomax, PhD, Head of Ontologies for SciBite at Elsevier

JL

Jane Lomax, PhD

Head of Ontologies, SciBite de Elsevier

Qu'est-ce qui a suscité votre passion pour les ontologies?

J'ai eu de la chance. J'ai commencé par le parasitisme et la génétique des populations. C'était génial, mais le travail en laboratoire humide est également prolongé et imprévisible. Je commençais à penser qu'une telle vie n'était pas faite pour moi. En fait, ce que j'ai le plus apprécié pendant mon doctorat, c'est l'analyse - la partie bioinformatique. Après mon doctorat, j'ai donc commencé à chercher dans ce domaine. C'est à cette époque que les premières bio-ontologies ont été créées, la Gene Ontology étant la première. Et c'est celui pour lequel j'ai fini par travailler. 

Personne ne savait ce qu'était une ontologie dans les sciences de la vie - et c'est souvent encore le cas aujourd'hui. Mais elle est beaucoup plus connue, parce qu'il y en a beaucoup maintenant. En revanche, à l'époque, personne ne savait de quoi il s'agissait, c’était un. Coup d'essai, qui a commencé sur une très petite échelle et qui a ensuite révolutionné le monde de la science. Un évenement exceptionnel auquel il fallait participer. 

Les ontologies ont pour but de classer les choses et d'organiser le monde ; cela a toujours été mon instinct. Tout s'est donc bien enchaîné. Le processus a également impliqué des informaticiens, des biologistes, des philosophes - nous nous sommes tous réunis pour essayer de résoudre ce problème. C'était un domaine vraiment passionnant - et il l'est toujours 20 ans plus tard.

Et maintenant, avec SciBite, vous appliquez des ontologies pour mettre encore plus d'ordre dans la masse de données scientifiques d'Elsevier.

À l'instar de Gene Ontology, SciBite a également démarré sur les chapeaux de roues. Nous l'avons développée pour en faire une entreprise mondiale employant près de 100 personnes, qu'Elsevier a ensuite rachetée pour pouvoir continuer à se développer et à mieux servir ses clients. Nous avons une équipe fantastique qui travaille très bien ensemble. Grâce à nos compétences et à nos logiciels, nous sommes en mesure d'aider nos clients, principalement des entreprises pharmaceutiques, à trouver une solution. C'est donc très satisfaisant : Nous sommes devenus bons pour extraire la compréhension des données.

Et maintenant, comme vous faîtes partie d'Elsevier, vous pouvez extraire élargir la compréhension à grande l'échelle.

C'est précisément ce que nous sommes en train de faire : appliquer cela à l'ensemble des suites d'Elsevier.

Et maintenant, après ce mariage parfait entre SciBite et Elsevier, vous introduisez une troisième partie : les grands modèles linguistiques. Cela ne complique-t-il pas les choses?

Cela pourrait faciliter grandement les choses. Ces nouvelles technologies vous permettent de poser des questions scientifiques en langage naturel. À leur tour, les LLM traduiront ces données en quelque chose de structuré et seront en mesure de les demander à travers toutes ces différentes sources de données. Puis ils reviennent avec quelque chose que les scientifiques peuvent comprendre, avec des références. Il ne s'agit donc plus d'une boîte noire, mais d'une sorte de solution d'IA explicable. Vous pouvez consulter les documents de recherche et vérifier. 

C'est donc très excitant : l'IA explicable avec les outils SciBite en s’appuyant sur les données de masse d'Elsevier. [S3] Mais oui, nous sommes encore en train de le découvrir. 

"C'est très excitant : l'IA explicable avec les outils SciBite en s’appuyant surà travers les données de masse d'Elsevier" 

Jane Lomax, PhD, Head of Ontologies for SciBite at Elsevier

JL

Jane Lomax, PhD

Head of Ontologies, SciBite de Elsevier

Et comment faites-vous face à la rapidité des développements et au battage médiatique qui les entoure? 

Tout va très vite et chacun essaie de trouver sa voie. Il y a un an, un poste comme celui d'ingénieur prompt n'existait pas. Lors d'une conférence récente, quelqu'un a dit que les LLM avaient le cycle le plus court de tous les temps, en particulier dans les sciences de la vie, parce que tout le monde disait : "Oh mon Dieu, ces choses sont extraordinaires" Puis, presque immédiatement, ils ont changé leur fusil d'épaule : "Nous ne pouvons pas les utiliser." 

Mais je pense que les ontologies joueront un rôle clé dans l'exploitation de la puissance des LLM. Entre-temps, l'ensemble de la communauté n'a pas encore trouvé sa voie. Mais de grands changements interviendront au cours des deux prochaines années. Nous allons agir rapidement et trouver notre place. C'est une période passionnante pour faire partie de cette communauté.

Y a-t-il d'autres aspects des LLM qui vous intéressent?

Je pense que la démocratisation de ces technologies sera essentielle. Auparavant, il y avait une barrière : Vous deviez être capable d'écrire en Python pour accéder à cet ensemble très riche d'outils. Tout cela a changé aujourd'hui. Des personnes de disciplines différentes pourront désormais accéder à ces technologies très puissantes, ce qui représente une démocratisation considérable. Et l'impact sur l'éducation ne fait que commencer à se faire sentir. Mon fils passe actuellement ses GCSE (examens de fin d'études secondaires) et crée des exemples de questions d'examen à l'aide de ChatGPT. Il va grandir en considérant que tout cela est normal et fait partie des outils qu'il est capable d'utiliser. Je pense donc que cela change la donne. 

Et comment voyez-vous l'évolution de SciBite en ces temps de mutation rapide? 

Je pense que nous allons continuer à être des pionniers et des innovateurs dans ce domaine. Je pense que ce que nous faisons bien, c'est d'être en mesure de créer des prototypes et de mettre au point de nouvelles technologies très rapidement. Je nous considère donc comme une sorte d'atelier d'innovation d'Elsevier. Nous pouvons encore renforcer certains produits d'Elsevier. Et une plus grande partie de notre matériel sera utilisée à grande échelle, ce qui nous dispensera d'une plus grande partie du travail fastidieux. Nous avons également quelques nouveaux produits qui s'attaquent à un obstacle majeur dans le monde de l'ontologie : le mappage entre les ontologies. Encore une fois, je suis très enthousiaste.

Y a-t-il quelque chose qui vous faciliterait la tâche en termes d'accélération de la R&D dans le domaine des sciences de la vie? Y a-t-il quelque chose que les gens peuvent faire?

Soutenir, financer et reconnaître toutes ces ontologies qui appuient toutes ces choses géniales que nous faisons. Et si vous n'avez pas d'argent, donnez votre avis : Utilisez votre expertise auprès de ces sources. Elles disposent tous d'un système de suivi public où vous pouvez faire des suggestions sur ce qui doit être corrigé ou ajouté. Pour améliorer les produits. 

Faites partie de ce cercle vertueux!

Contributeur

Ann-Marie Roche

AR

Ann-Marie Roche

Senior Director of Customer Engagement Marketing

Elsevier

En savoir plus sur Ann-Marie Roche