資料集
人工智慧和數位轉型的資料集
人工智慧和數位轉型正迅速成為主流。結合您的既有知識與我們經過策劃和豐富的特定領域資料,以更準確回答研發問題。了解以下資料套裝和自定義選項。
加速發現
將可靠和可行的科學資料整合到自定義應用程式和第三方工具中,以實現業務使用案例,例如:
企業、聯合,和/或語義搜尋
商業智能儀表板
知識圖表建立
明日之星與 KOL 分析
準確分析
將 Elsevier 資料集整合至你的運算生態系統,將經驗證的資料轉化為科學見解。
訓練演算法和神經網絡
開發預測模型,比如材料特性預測和藥物間交互作用
執行蛋白質配體結合 QSAR
自動執行並改進任務和工作流程
Changing AI in drug discovery
Elsevier understands the challenges of life sciences R&D. Our comprehensive, high-quality and machine-readable datasets provide clear data provenance and support evidence-based decisions. Through our vast history of supporting the life sciences, we can provide:
Curated datasets from full-text articles in disciplines across life sciences, including medicine, chemistry, biochemistry, genetics, immunology, microbiology, pharmacology, toxicology and more.
FAIR data in 11 therapy areas
Specialized data, such as bioactivity data, biological relationships, substances, reactions and more
What types of datasets are available?
根據你的需求提供各種彈性的資料套裝,包括:
來自 24 種主要學科領域的 2,500 種期刊的資料
11 個治療領域的 FAIR 資料──使用機器讀取的中繼資料豐富期刊全文,包括 《Cell Press》和 《Lancet》雜誌的高級收藏刊物。
摘要、作者和所屬單位以及評估指標的三種資料集涵蓋了 7,000 家出版商的 24 個研究學科。從經同儕審查的科學期刊、書籍、叢書、專利和會議論文集中的提取資料,其中有:
18 億篇引用參考文獻
1,760 萬份作者簡介
94,800 篇機構檔案
超過 149,000 場活動的 1,170 萬份研討會論文
通過 API 或平面檔案而獲得,經過實驗證實的化學結構、反應和生物活性資料
來自各種來源的資料集,包括:
2.64 億種物質和相關特性
6,200 萬個反應,附有實驗條件和文獻參考資料
源自 16,000 份期刊的 6,500 萬份文件
源自 105 個專利局的 3,800 萬項專利
4,400 萬種生物活性
32,000 種特定標靶
54,000 種物種
以 Emtree 生命科學辭庫為索引,生物醫學同儕審查文獻、報刊出版物和會議摘要中的資料和資料源包括:
4,100 萬條記錄
8,300 種期刊,包括 2,900 份在 MEDLINE 上找不到的期刊
來自 11,500 場研討會的 360 萬份研討會摘要
The Dataset currently includes 18.6 million biological relationships from 36 million MEDLINE abstracts and 7.6 million full-text articles. These include protein-protein interactions, and effects of proteins, compounds and cells on diseases and cell processes. The information comes from full-text literature on Elsevier’s ScienceDirect, and from other high-impact publishers, and public and proprietary databases. The Dataset also includes:
1.3 million small molecule protein interactions from Reaxys
150,000 data points from ClinicalTrials.gov
600,000 relationships from public databases of protein-protein interactions, small molecule protein interactions, MiRNA effects, SNP annotations and more
各種 API 提供從 FDA 和 EMA 監管文件中提取的結構性資料,包括:
5,000 種已核准藥物
200 萬筆經擷取的 PK 資料記錄中逾 95 個 PK 參數
600,000 筆的酶和轉運資料記錄:藥物作為誘導物、抑制劑或受質
180 萬條安全與不良事件資料
從監管文件中擷取了 380 萬筆臨床試驗療效數據
資料來源:
300 萬頁 FDA 批准文件,包括標籤、批准包裝、DESI 文件、諮詢委員會文件
384,000 頁 EMA 批准文件
2,000 萬 FDA 上市後報告(FAERS)