Datasets
Datasets para la IA y la transformación digital
La IA y la transformación digital se están generalizando a un ritmo acelerado. Combine su conocimiento interno con nuestros datos seleccionados y enriquecidos de dominios específicos para responder preguntas de I+D con mayor precisión.
Acelerar el descubrimiento
Integre datos científicos fiables y procesables en aplicaciones personalizadas y herramientas de terceros para permitir casos de uso empresarial, como por ejemplo:
Búsqueda empresarial, federada y/o semántica
Paneles de inteligencia empresarial
Creación de gráficos de conocimiento
Análisis de jóvenes promesas y líderes de opinión (Key Opinion Leaders, KOL)
Análisis precisos
Transforme los datos validados en conocimientos científicos mediante la incorporación de datasets de Elsevier en sus ecosistemas computacionales para lo siguiente:
Entrenar algoritmos y redes neuronales
Desarrollar modelos predictivos, como predicciones de propiedades de materiales o interacciones entre medicamentos
Realizar QSAR de unión proteína-ligando
Automatizar y mejorar tareas y flujos de trabajo
Changing AI in drug discovery
Elsevier understands the challenges of life sciences R&D. Our comprehensive, high-quality and machine-readable datasets provide clear data provenance and support evidence-based decisions. Through our vast history of supporting the life sciences, we can provide:
Curated datasets from full-text articles in disciplines across life sciences, including medicine, chemistry, biochemistry, genetics, immunology, microbiology, pharmacology, toxicology and more.
FAIR data in 11 therapy areas
Specialized data, such as bioactivity data, biological relationships, substances, reactions and more
What types of datasets are available?
Se dispone de paquetes de datos flexibles adaptados a sus necesidades, que incluyen:
Datos de 2500 revistas que representan 24 áreas disciplinarias principales
Datos FAIR en 11 áreas terapéuticas: datos enriquecidos de revistas de texto completo con metadatos legibles por máquina, incluidos títulos de colecciones premium de Cell Press y The Lancet.
Lea más sobre datasets científicos en texto completo de Elsevier.
Descargue la hoja informativa se abre en una nueva pestaña/ventana
Tres datasets de resúmenes, autores y afiliaciones, y métricas de evaluación cubren 24 disciplinas de investigación de 7000 editoriales. Los datos extraídos de revistas científicas revisadas por pares, libros, publicaciones periódicas, patentes y actas de conferencias incluyen:
1800 millones de referencias citadas
17,6 millones de perfiles de autor
94 800 perfiles institucionales
11,7 millones de artículos de conferencias de más de 149 000 eventos
Descargue la hoja informativa se abre en una nueva pestaña/ventana
Datos de estructura química, reacción y bioactividad que han sido validados experimentalmente y están disponibles a través de API o archivo plano.
Los datasets provienen de una variedad de fuentes, que incluyen:
264 millones de sustancias y propiedades asociadas
62 millones de reacciones con condiciones experimentales y referencias bibliográficas
65 millones de documentos de 16 000 revistas
38 millones de patentes de 105 oficinas de patentes
44 millones de bioactividades
32 000 objetivos únicos
54 000 especies
Descargue la hoja informativa se abre en una nueva pestaña/ventana
Indexados con el tesauro de ciencias biológicas de Emtree, los datos y fuentes de datos de bibliografía biomédica revisada por pares, publicaciones en prensa y resúmenes de conferencias incluyen:
41 millones de registros
8300 revistas, incluidas 2900 no encontradas en MEDLINE
3,6 millones de resúmenes de 11 500 conferencias
Descargue la hoja informativa se abre en una nueva pestaña/ventana
The Dataset currently includes 18.6 million biological relationships from 36 million MEDLINE abstracts and 7.6 million full-text articles. These include protein-protein interactions, and effects of proteins, compounds and cells on diseases and cell processes. The information comes from full-text literature on Elsevier’s ScienceDirect, and from other high-impact publishers, and public and proprietary databases. The Dataset also includes:
1.3 million small molecule protein interactions from Reaxys
150,000 data points from ClinicalTrials.gov
600,000 relationships from public databases of protein-protein interactions, small molecule protein interactions, MiRNA effects, SNP annotations and more
Download the EmBiology Dataset factsheet se abre en una nueva pestaña/ventana
Una variedad de API ofrecen datos estructurados extraídos de documentos normativos de la FDA y la EMA, que incluyen:
5000 medicamentos aprobados
2 millones de registros de datos farmacocinéticos extraídos con más de 95 parámetros farmacocinéticos
600 000 registros de datos extraídos de enzimas y transportadores: fármaco como inductor, inhibidor o sustrato
1,8 millones de datos extraídos de seguridad y acontecimientos adversos
3,8 millones de datos de eficacia extraídos de ensayos clínicos de paquetes regulatorios
Fuentes de datos:
3 millones de páginas de documentos de aprobación de la FDA, incluidas etiquetas, paquetes de aprobación, documentos DESI y documentos del Consejo Asesor
384 000 páginas de paquetes de aprobación de la EMA
20 millones de informes poscomercialización de la FDA (FAERS)
Descargue la hoja informativa se abre en una nueva pestaña/ventana