Datasets
Datasets for AI and digital transformation
AIとデジタルトランスフォーメーション(DX)は加速度的に主流になりつつあります。社内のナレッジとエルゼビアの分野ごとにキュレーションし精査されたデータを組み合わせることにより、研究開発に関する課題により高い精度で対応することができます。データパッケージとカスタムオプションについては下記をご参照ください。
Accelerate discovery
信頼性があり実用的な科学データをカスタムアプリケーションやサードパーティツールに統合し、下記のようなビジネスユースケースを可能に:
エンタープライズ、フェデレーテッドまたはセマンティック検索
ビジネスインテリジェンスダッシュボード
ナレッジグラフの作成
Rising star(将来有望な研究者)とKOL分析
Accurate analyses
エルゼビアのデータセットをお客様のコンピュテーショナルエコシステムに組み込むことにより有効なデータを科学的なインサイトに変換:
アルゴリズムとニューラルネットワークのトレーニング
材料特性予測または薬物間相互作用のような予測モデルを開発
タンパク質-リガンド結合 QSARの実施
タスクとワークフローの自動化と強化
Changing AI in drug discovery
エルゼビアはライフサイエンス分野における研究開発の課題を理解しています。包括的で高品質で機械可読なデータセットは、データソースを明確にし、エビデンスに基づいて意思決定をサポートします。ライフサイエンス分野をサポートし続けてきたエルゼビアは、次のようなサービスを提供しています:
医学、化学、生化学、遺伝子学、免疫学、微生物学、薬理学、毒性学など、ライフサイエンス全般にわたる分野の論文全文からキュレーションされたデータセット
11の治療領域におけるFAIRデータ
生理活性データ、生物学的関係、物質、反応などの専門データ 詳細はこちら
エルゼビアの提供するデータセット
お客様のニーズに合わせたフレキシブルなデータパッケージをご用意:
24の主要な専門分野を代表する2,500誌のデータ
11の治療エリアにおけるFAIRデータ – 機械解読可能なメタデータで強化され、Cell PressやThe Lancetなどのプレミアムコレクションを含むフルテキストのジャーナルデータ
抄録、著者、所属機関の3つのデータセット、そして評価指標は、7,000の出版社による24の研究分野をカバーしています。
査読付き科学雑誌、書籍、逐次刊行物、特許、そして学会会議録から抽出されたデータ:
18億件の引用文献
1,760万人の著者プロファイル
94,800機関のプロファイル
149,000以上の項目からの1,170万件の学会論文
実験的に検証された化学構造、反応とバイオアクティビティデータをAPIまたはフラットファイル経由で利用可能:
物質・特性値:2億6400万個
反応・実験条件および参考文献:6,200万件
16,000ジャーナルから6,500万件のドキュメント
105特許庁から3,800万件の特許データ
バイオアクティビティ:4,400万
ユニークターゲット:32,000
生物種:54,000
Emtree 生命科学シソーラスで索引付けされた、バイオメディカル査読付き文献、インプレス出版物、学会抄録からのデータとデータソース:
4,100万件のレコード
MEDLINEに収録のない2,900誌を含む8,300誌
11,500の学会から360万件の学会抄録
データセットでは3600万件のMEDLINEの要旨と760万件のフルテキスト論文から抽出された1,860万件の生物学的関係性のデータを扱っています。これには、タンパク質間相互作用や、タンパク質、化合物、細胞が疾患や細胞プロセスに及ぼす影響の情報が含まれています。これらの情報は、ScienceDirectのフルテキスト文献や、他の出版社、パブリックおよび独自のデータベースから収録されています。
[収録データ]
Reaxysから130万件の低分子タンパク質相互作用について
ClinicalTrials.govからの15万件のデータ
タンパク質間相互作用、低分子タンパク質相互作用、MiRNAの影響、SNPのアノテーションなどパブリックデータベースからの60万件の関係性情報
様々なAPIによりFDAやEMAの承認審査報告書から抽出した以下のような構造化データを提供
承認された医薬品5,000品目
95以上のPKパラメータに関する200万件の抽出されたPKデータ
600,000の抽出された酵素とトランスポーターデータ誘導剤、阻害剤、基質としての薬剤
180万件の安全性及び有害事象の抽出データ
審査パッケージから抽出された380万件の臨床試験の有効性データ
データソース:
ラベル、承認パッケージ、DESI文書、諮問委員会文書を含む300万ページのFDA承認文書
384,000ページにおよぶEMA承認パッケージ
2,000万件のFDA市販後レポート(FAERS)