文字和資料探勘
找到更好的方式下載、搜尋、篩選和理解在 ScienceDirect 出版的數百萬論文和書籍。 所有 Elsevier 期刊和書籍都支援文字和資料探勘(TDM)。 即刻瞭解更多資訊。
TDM 基礎
為什麼使用學術論文?
已出版的論文和書籍內有你可能在尋找的資訊,而文字探勘是解鎖這些知識的理想方法。這些論文和書籍章節都經過精心選編,是值得信賴的資訊來源,而且更重要的是,裡面涵蓋了各個學科領域的大量資料,甚至追溯至最早的出版論文。
開始
文字探勘過程中,首先需要找到和下載你希望挖掘的內容,然後對這些內容運用特殊文字探勘工具,找到所需的資料。我們的全文論文程式設計介面(article programming interface,API)旨在進行非商業性研究文字探勘,讓你以輕鬆簡單的方式大量下載 Elsevier 的內容。你可從我們的開發者入口網站取用全文 API。
為何使用 API?
文字探勘需要眾多的不同工具和資源來發揮作用,也需要研究員大量技能的投入為了助你輕鬆入門,我們建立了 API,讓你輕鬆下載大量欲探勘的內容,並以程式語言處理。 API 可使你:
更有效率:網路資料爬梳是一種取得大量內容的低效方法,但是透過我們的 API,你可以快速輕鬆地取用和下載所需的資料。
獲得最佳的資料格式:Elsevier 將期刊論文和書籍章節轉換為 XML,這是文字探勘者偏愛的格式。
確保一致性:共有超過 200 萬篇的論文和書籍章節供你取用,讓探勘者準確辨識並提取所需的關鍵部分。我們的 API 為所有可用資料提供統一格式,使你更輕鬆啟動和測試 TDM 工具
Want to mine across different publishers?
希望在不同出版人之間進行探勘嗎?
開始文字探勘時,您可能希望挖掘不同出版商、多種期刊的資料。 這會引發後勤問題。 為了讓文字探勘更輕鬆,我們支援 Crossref TDM 服務。 這項免費服務為你提供 Crossref Metadata API,可以用來取用 Crossref DOI 在各出版人網站上標識的內容全文。

測試你的 TDM 工具
文字探勘依賴自然語言處理(Natural Language Processing,NLP)工具的使用。 為了開發和完善學術文獻專用的 NLP 工具,我們建立了一個公開取用的論文語料庫。 這些對你測試和完善自己的工具非常有用。

學習與支援
了解如何取用和利用文字探勘來支援你的下一個研究專案:
To get started go to our developers portal 打開新的分頁/視窗
Learn more about how to text mine using our full text API 打開新的分頁/視窗
For further details about accessing Elsevier content see our text and data mining policy
Download our text and data mining glossary 打開新的分頁/視窗
See our FAQs for details about how to register for the API and share and/or use your TDM corpus
To access and mine content from other publishers please see CrossRef Text and Data mining services 打開新的分頁/視窗
For commercial text mining of Elsevier content see our professional R&D services text mining solutions