跳转到主内容

非常抱歉,我们不完全支持您的浏览器。如果您可以选择,请升级到较新版本或使用 Mozilla Firefox、Microsoft Edge、Google Chrome 或 Safari 14 或更高版本。如果您无法进行此操作且需要支持,请将您的反馈发送给我们。

全新设计的官网为您带来全新体验,期待您的反馈 在新的选项卡/窗口中打开

Elsevier
通过我们出版

文本和数据挖掘

寻找更好的方法来下载、搜索、过滤和理解 ScienceDirect 上发表的数百万篇文章和书籍。所有爱思唯尔期刊和书籍均支持文本和数据挖掘 (TDM)。立即了解更多信息。

TDM 基础

为什么要使用学术文章?

已出版的文章和书籍已经包含您可能正在寻找的信息,文本挖掘是解锁这些知识的理想途径。此外,文章和书籍章节经过精心策划,是值得信赖的信息来源,更重要的是,所有学科都有大量的此类信息,可追溯到第一篇出版的文章。

入门教程

文本挖掘要求您首先访问并下载想要挖掘的内容,然后对该内容运行特殊的文本挖掘工具,以找到要查找的内容。我们的全文文章编程接口 (API) 是您批量下载 Elsevier 内容并用于非商业研究文本挖掘目的简单易行的方法。您可通过我们的开发者门户网站访问全文 API。我们的 API 包括开放获取内容,但您也可以使用 DOI 检索功能 https://api.elsevier.com/content/article/doi/[DOI] 挖掘 OA 内容,您的自动化脚本可在该功能上运行。

为什么使用 API?

文本挖掘需要大量不同的工具和资源才能发挥作用,还需要科研人员投入大量的技能。为帮助您入门,我们建立了API,以便更轻松地下载通常需要使用编程语言挖掘的大量内容。使用 API,您能够:

  • 更加高效:网络爬行是一种低效的采集大量内容的方法,使用我们的 API,您可以快速、轻松地访问和下载您需要的数据。

  • 以更好的格式检索数据:爱思唯尔将我们的期刊文章和书籍章节转换为 XML,这是文本挖掘者首选的格式。

  • 确保一致性:有 200 多万篇文章和书籍章节可供选择,对于文本挖掘者来说,能够确定他们希望提取的关键部分非常重要。我们的 API 为所有可用数据提供一致的格式,您可以更轻松地运行和测试 TDM 工具

想要对不同出版商进行文本挖掘吗?

开始文本挖掘时,您不可避免地希望在不同出版商出版的多种期刊上进行文本挖掘。这就产生了一个逻辑问题。为了简化文本挖掘,我们支持 Crossref TDM 服务。这项免费服务为您提供 Crossref 元数据 API,可用于访问由 Crossref DOI 标识的不同出版商网站的内容的全文。

交叉引用标志

测试您的 TDM 工具

文本挖掘依赖于自然语言处理 (NLP) 工具的使用。为了开发和完善专门用于学术文献的 NLP 工具,我们创建了一个开放获取的文章语料库。这将有助于测试和改进您的工具。

开放获取 STM 语料库的屏幕截图

学习和支持

了解如何访问和使用文本挖掘来支持您的下一个科研项目: