文本和数据挖掘
寻找更好的方法来下载、搜索、过滤和理解 ScienceDirect 上发表的数百万篇文章和书籍。所有爱思唯尔期刊和书籍均支持文本和数据挖掘 (TDM)。立即了解更多信息。
TDM 基础
为什么要使用学术文章?
已出版的文章和书籍已经包含您可能正在寻找的信息,文本挖掘是解锁这些知识的理想途径。此外,文章和书籍章节经过精心策划,是值得信赖的信息来源,更重要的是,所有学科都有大量的此类信息,可追溯到第一篇出版的文章。
入门教程
文本挖掘要求您首先访问并下载想要挖掘的内容,然后对该内容运行特殊的文本挖掘工具,以找到要查找的内容。我们的全文文章编程接口 (API) 是您批量下载 Elsevier 内容并用于非商业研究文本挖掘目的简单易行的方法。您可通过我们的开发者门户网站访问全文 API。我们的 API 包括开放获取内容,但您也可以使用 DOI 检索功能 https://api.elsevier.com/content/article/doi/[DOI] 挖掘 OA 内容,您的自动化脚本可在该功能上运行。
为什么使用 API?
文本挖掘需要大量不同的工具和资源才能发挥作用,还需要科研人员投入大量的技能。为帮助您入门,我们建立了API,以便更轻松地下载通常需要使用编程语言挖掘的大量内容。使用 API,您能够:
更加高效:网络爬行是一种低效的采集大量内容的方法,使用我们的 API,您可以快速、轻松地访问和下载您需要的数据。
以更好的格式检索数据:爱思唯尔将我们的期刊文章和书籍章节转换为 XML,这是文本挖掘者首选的格式。
确保一致性:有 200 多万篇文章和书籍章节可供选择,对于文本挖掘者来说,能够确定他们希望提取的关键部分非常重要。我们的 API 为所有可用数据提供一致的格式,您可以更轻松地运行和测试 TDM 工具
想要对不同出版商进行文本挖掘吗?
开始文本挖掘时,您不可避免地希望在不同出版商出版的多种期刊上进行文本挖掘。这就产生了一个逻辑问题。为了简化文本挖掘,我们支持 Crossref TDM 服务。这项免费服务为您提供 Crossref 元数据 API,可用于访问由 Crossref DOI 标识的不同出版商网站的内容的全文。
测试您的 TDM 工具
文本挖掘依赖于自然语言处理 (NLP) 工具的使用。为了开发和完善专门用于学术文献的 NLP 工具,我们创建了一个开放获取的文章语料库。这将有助于测试和改进您的工具。
学习和支持
了解如何访问和使用文本挖掘来支持您的下一个科研项目:
要开始使用,请访问我们的 开发人员门户 在新的选项卡/窗口中打开
进一步了解如何使用我们的 全文 API 在新的选项卡/窗口中打开 进行文本挖掘
有关访问 Elsevier 内容的更多详情,请参阅我们的 文本和数据挖掘政策
下载我们的 文本和数据挖掘词汇表 在新的选项卡/窗口中打开
请参阅我们的 常见问题及回答 ,了解有关如何注册 API 以及共享和/或使用您的 TDM 语料库的详细信息
要访问和挖掘其他出版商的内容,请参阅 CrossRef 文本和数据挖掘服务 在新的选项卡/窗口中打开
有关内容的商业文本挖掘,请参阅我们的 专业研发服务文本挖掘解决方案