テキストとデータマイニング
ScienceDirect に公開されている何百万もの論文や書籍をダウンロード、検索、フィルタリング、理解するためのより良い方法を見つけます。Elsevier のすべてのジャーナルで、テキストとデータマイニング(TDM)が可能です。 今すぐ詳細をご確認ください。
TDM の基礎知識
学術論文を使う理由
出版された論文および書籍には、ユーザーが求めているであろう情報がすでに含まれており、テキストマイニングはその知識を掘り起こす理想的な方法です。論文と書籍の章もキュレーションされており、信頼できる情報源となっています。さらに重要なのは、最初に発表された論文までさかのぼると、あらゆる分野にまたがる多くの情報があるということです。
Getting started
テキストマイニングでは、まずマイニングしたいコンテンツにアクセスしてダウンロードし、そのコンテンツに対して専用のテキストマイニングツールを実行して、探しているものを見つける必要があります。フルテキストarticle programming interface(API)は、非商用の研究用テキストマイニングを目的として、Elsevier のコンテンツを一括ダウンロードするための簡単かつシンプルな方法です。開発者ポータルからフルテキスト API にアクセスすることができます。API にはオープンアクセスコンテンツが含まれていますが、自動化スクリプトが実行できる DOI 検索機能 https://api.elsevier.com/content/article/doi/[DOI] を使用して OA コンテンツをマイニングすることもできます。
API を使用する理由
テキストマイニングを行うには、さまざまなツールやリソース、そして研究者の高度なインプットが必要です。これを始める手助けとして、私たちは API を構築し、ユーザーが通常必要とする量のコンテンツを、プログラム言語でより簡単にダウンロードできるようにしました。 API を使うことで、以下が可能になります。
より効率的: ウェブクローリングは、大量のコンテンツを収集する非効率的な方法です。弊社の API を使用することで、必要なデータに素早く簡単にアクセスし、ダウンロードすることができます。
より良い形式でのデータ取得: Elsevierは、ジャーナルの論文や書籍の章を、テキストユーザーに好まれるXML形式に変換します。
一貫性の確保: 200万を超える論文と書籍の章が利用可能であるため、ユーザーが抽出したい重要な部分を特定できるようにすることが重要です。弊社のAPIは、利用可能なすべてのデータに対して一貫した形式を提供し、TDM ツールの実行とテストをより簡単にします。
Want to mine across different publishers?
いろいろな出版社のマイニングを行いたいと考えていますか?
テキストマイニングを始めるとどうしても、異なる出版社が発行する複数のジャーナルにわたって行いたいと思うようになります。これはロジスティクス上の問題につながります。テキストマイニングを容易にするために、弊社は Crossref TDM サービスを サポートしています。この無料サービスは出版社サイト全体の Crossref DOI で特定されるコンテンツの全文にアクセスするために使用できる Crossref Metadata API を提供します。
TDM ツールのテスト
テキストマイニングは、Natural Language Processing(NLP)ツールの使用に依存しています。学術文献に特化した NLP ツールを開発し、改良するために、弊社はオープンアクセスの論文コーパスを作成しました。これらはツールをテストし、改良する上で役立ちます。
Learn & support
次回の研究プロジェクトをサポートするために、テキストマイニングにアクセスして使用する方法をご紹介します。
To get started go to our developers portal 新しいタブ/ウィンドウで開く
Learn more about how to text mine using our full text API 新しいタブ/ウィンドウで開く
For further details about accessing Elsevier content see our text and data mining policy
Download our text and data mining glossary 新しいタブ/ウィンドウで開く
See our FAQs for details about how to register for the API and share and/or use your TDM corpus
To access and mine content from other publishers please see CrossRef Text and Data mining services 新しいタブ/ウィンドウで開く
For commercial text mining of Elsevier content see our professional R&D services text mining solutions