Jeux de données
Jeux de données pour l’IA et la transformation numérique
L’IA et la transformation numérique se généralisent à un rythme effréné. Combinez vos connaissances internes avec les données spécifiques du domaine que nous couvrons et enrichissons pour répondre aux questions de R&D avec une plus grande précision.
Accélérer la découverte
Intégrez des données scientifiques fiables et exploitables à des applications personnalisées et des outils tiers pour permettre les cas d’utilisation professionnels, notamment:
Recherche d’entreprise, fédérée et/ou sémantique
Tableaux de bord de Business Intelligence
Création de graphiques des connaissances
Analyses des étoiles montantes et des KOL
Analyses précises
Transformez des données validées en perspectives scientifiques, en incorporant des jeux de données Elsevier dans vos écosystèmes informatiques, pour:
Former des algorithmes et des réseaux neuronaux
Développer des modèles prédictifs, tels que des prédictions de propriétés matérielles ou d’interactions médicamenteuses
Réaliser des modèles QSAR de liaison protéine-ligand
Automatiser et améliorer les tâches et les flux de travail
Changing AI in drug discovery
Elsevier understands the challenges of life sciences R&D. Our comprehensive, high-quality and machine-readable datasets provide clear data provenance and support evidence-based decisions. Through our vast history of supporting the life sciences, we can provide:
Curated datasets from full-text articles in disciplines across life sciences, including medicine, chemistry, biochemistry, genetics, immunology, microbiology, pharmacology, toxicology and more.
FAIR data in 11 therapy areas
Specialized data, such as bioactivity data, biological relationships, substances, reactions and more
What types of datasets are available?
Des packages de données flexibles, adaptés à vos besoins, sont disponibles, notamment :
Données provenant de 2 500 revues représentant 24 grandes disciplines
Données FAIR dans 11 domaines thérapeutiques : données de revues en texte intégral, enrichies de métadonnées lisibles par machine, y compris des titres de collections premium de Cell Press et du Lancet
En savoir plus sur les jeux de données scientifiques en texte intégral d’Elsevier.
Télécharger la fiche d’informations S’ouvre dans une nouvelle fenêtre
Trois jeux de données de résumés, d’auteurs et d’affiliations, et d’indicateurs d’évaluation couvrent 24 disciplines de recherche et 7 000 éditeurs. Les données extraites de revues scientifiques évaluées par les pairs, de livres, de publications en série, de brevets et d’actes de conférences comprennent:
1,8 milliard de références citées
17,6 millions de profils d’auteurs
94 800 profils institutionnels
11,7 millions d’articles de conférence provenant de plus de 149 000 événements
Télécharger la fiche d’informations S’ouvre dans une nouvelle fenêtre
Données sur les structures chimiques, les réactions et la bioactivité, validées de façon expérimentale, qui sont disponibles via API ou fichier à plat.
Les ensembles de données proviennent de sources diverses, notamment:
264 millions de substances et propriétés associées
62 millions de réactions avec conditions expérimentales et références bibliographiques
65 millions de documents issus de 16 000 revues
38 millions de brevets provenant de 105 offices de brevets
44 millions de bioactivités
32 000 cibles uniques
54 000 espèces
Télécharger la fiche d’informations S’ouvre dans une nouvelle fenêtre
Indexées avec le thésaurus des sciences de la vie Emtree, les données et les sources de données de la littérature biomédicale revue par les pairs, des publications en presse et des résumés de conférences comprennent :
41 millions d’enregistrements
8 300 revues, dont 2 900 ne figurent pas dans MEDLINE
3,6 millions de résumés de conférences provenant de 11 500 conférences
Télécharger la fiche d’informations S’ouvre dans une nouvelle fenêtre
The Dataset currently includes 18.6 million biological relationships from 36 million MEDLINE abstracts and 7.6 million full-text articles. These include protein-protein interactions, and effects of proteins, compounds and cells on diseases and cell processes. The information comes from full-text literature on Elsevier’s ScienceDirect, and from other high-impact publishers, and public and proprietary databases. The Dataset also includes:
1.3 million small molecule protein interactions from Reaxys
150,000 data points from ClinicalTrials.gov
600,000 relationships from public databases of protein-protein interactions, small molecule protein interactions, MiRNA effects, SNP annotations and more
Download the EmBiology Dataset factsheet S’ouvre dans une nouvelle fenêtre
Diverses API proposent des données structurées extraites de documents réglementaires de la FDA et de l’EMA, dont :
5 000 médicaments approuvés
2 millions d’enregistrements de données pharmacocinétiques extraites sur plus de 95 paramètres pharmacocinétiques
600 000 données extraites sur les enzymes et les transporteurs : le médicament en tant qu’inducteur, inhibiteur ou substrat
1,8 million de données extraites sur la sécurité et les événements indésirables
3,8 millions de données d’efficacité extraites d’essais cliniques provenant de dossiers réglementaires
Sources de données :
3 millions de pages de documents d’approbation de la FDA, y compris les étiquettes, les dossiers d’approbation, les documents DESI et les documents de conseil consultatif
384 000 pages de dossiers d’approbation de l’EMA
20 millions de rapports post-commercialisation de la FDA (FAERS)
Télécharger la fiche d’informations S’ouvre dans une nouvelle fenêtre