Text- und Data-Mining
Eine bessere Möglichkeit, Millionen von Artikeln und Büchern, die auf ScienceDirect veröffentlicht sind, herunterzuladen, zu filtern und zu verstehen. Alle Wissenschaftsjournals und Fachbücher von Elsevier ermöglichen Text und Data Mining (TDM). Weitere Informationen
Grundlagen zu TDM
Warum wissenschaftliche Artikel nutzen?
Veröffentlichte Artikel und Bücher enthalten bereits die Informationen, nach denen Sie suchen, und Text-Mining ist eine ideale Möglichkeit, um dieses Wissen freizuschalten. Artikel und Buchkapitel sind auch kuratiert und eine zuverlässige Informationsquelle. Darüber hinaus gibt es davon sehr viele in allen Disziplinen, und sie reichen bis zum ersten veröffentlichten Artikel zurück.
Erste Schritte
Greifen Sie zum Text-Mining zuerst auf den Inhalt zu, den Sie gewinnen möchten, laden Sie diesen herunter, und lassen Sie dann die spezifischen Text-Mining-Tools über diesen Inhalt laufen, um das Gesuchte zu finden. Die Programmierschnittstelle (API) zu den Volltextartikeln stellt eine leichte und einfache Methode dar, um Elsevier-Inhalte für nichtkommerzielle Text-Mining-Forschungszwecke in großen Mengen herunterzuladen. Sie erhalten Zugriff zur Volltext-API über das Entwickler-Portal. Die API umfasst Open-Access-Inhalte, aber Sie können OA-Inhalte auch über die DOI-Retrievalfunktionalität https://api.elsevier.com/content/article/doi/[DOI] gewinnen, über die Sie Ihr automatisiertes Skript laufen lassen.
Warum eine API verwenden?
Text-Mining erfordert eine Menge verschiedener Tools und Ressourcen, damit es funktioniert, und eine Menge qualifizierter Beiträge von den Forschenden. Um Ihnen den Einstieg zu erleichtern, haben wir APIs entwickelt, die das Herunterladen von Inhalten, die Sie üblicherweise auswerten möchten, in einer programmatischen Sprache wesentlich erleichtern. Die Nutzung einer API ermöglicht Folgendes:
Höhere Effizienz: Webcrawling ist eine ineffiziente Methode, um große Mengen an Inhalten zu gewinnen. Durch Nutzung unserer APIs können Sie schnell und einfach auf die benötigten Daten zugreifen und diese herunterladen.
Abruf Ihrer Daten in einem besseren Format: Elsevier konvertiert seine Artikel aus Wissenschaftsjournals und Buchkapiteln in XML, einem Format, das von den meisten Text-Minern bevorzugt wird.
Gewährleistung von Konsistenz: Bei mehr als 2 Millionen verfügbaren Artikeln und Buchkapiteln ist es für Miner bedeutend, wichtige Teile, die sie extrahieren möchten, zu identifizieren. Unsere API bietet ein konsistentes Format für alle verfügbaren Daten, sodass Sie Ihre TDM-Tools einfacher „drüberlaufen" lassen und testen können.
Möchten Sie verschiedene Herausgeber*innen in das Mining-Verfahren einbeziehen?
Wenn Sie mit dem Text-Mining beginnen, werden Sie zwangsläufig multiple Wissenschaftsjournals von verschiedenen Herausgeber*innen einbeziehen wollen. Dies stellt ein logistisches Problem dar. Damit das Text-Mining einfacher wird, unterstützten wir den TDM-Service von Crossref. Dieser freie Service stellt die Metadaten-API von Crossref zur Verfügung, die für den Zugriff auf die Volltexte der Inhalte genutzt wird, die von den Crossref DOIs über mehrere Webseiten der Herausgeber hinweg identifiziert werden.
Testen Sie Ihre TDM-Tools
Text-Mining hängt von der Nutzung der Tools für die Verarbeitung der natürlichen Sprache (Natural Language Processing, NLP) ab. Wir haben für die Entwicklung und Verfeinerung der NLP-Tools, die für die wissenschaftliche Literatur spezialisiert sind, einen Korpus an Artikeln für Open Access erstellt. Damit können Sie Ihre Tools testen und verfeinern.
Lernen und unterstützen
Wie Sie mittels Text-Mining Ihr nächstes Forschungsprojekt unterstützen können:
Um zu beginnen, gehen Sie auf unser developers portal Wird in neuem Tab/Fenster geöffnet
Erfahren Sie mehr darüber, wie Sie mit unserem API-Tool Wird in neuem Tab/Fenster geöffnet Textmining machen können
Weiter Informationen über den Zugriff auf Elsevier-Inhalte finden Sie in unserer text and data mining policy
Laden Sie unserer text and data mining glossary Wird in neuem Tab/Fenster geöffnet herunter
Lesen Sie unsere FAQs und erfahren Sie die Details zur Registrierung für API und teilen/nutzen Sie unseren TDM-Korpus
Für den Zugriff auf Inhalte von anderen Verlagen und deren Auswertung gehen Sie bitte auf CrossRef Text and Data mining services Wird in neuem Tab/Fenster geöffnet
Für kommerzielles Textmining von Elsevier-Inhalten schauen Sie auf professional R&D services text mining solutions