Mineração de dados e texto
Encontre a melhor maneira de fazer o download, pesquisar, filtrar e compreender milhões de artigos e livros publicados na ScienceDirect. Todos os livros e periódicos da Elsevier permitem mineração de dados e texto (TDM). Descubra mais hoje.
Fundamentos de TDM
Por que usar artigos acadêmicos?
Artigos e livros publicados já contêm as informações que você pode estar procurando e a mineração de texto é a maneira ideal de desbloquear esse conhecimento. Artigos e capítulos de livros também são selecionados e constituem uma fonte confiável de informações e, o que é mais importante, há uma grande quantidade deles em todas as disciplinas, desde o primeiro artigo publicado.
Guia de introdução
A mineração de texto exige que, em primeiro lugar, você acesse e faça o download do conteúdo que deseja analisar e, em seguida, execute ferramentas especiais de mineração de texto sobre esse conteúdo para encontrar o que está procurando. Nossa interface de programação de artigo de texto completo (API) é uma maneira fácil e simples para fazer o download em massa do conteúdo da Elsevier para fins de mineração de texto para pesquisa não comercial. É possível obter acesso à API de texto completo em nosso portal de desenvolvedores. Nossa API inclui conteúdo de acesso aberto, mas também é possível extrair esse conteúdo usando a função de recuperação DOI https://api.elsevier.com/content/article/doi/[DOI] na qual seu script automatizado pode ser executado.
Por que usar uma API?
A mineração de texto requer muitas ferramentas e recursos diferentes para funcionar, além de várias contribuições qualificadas dos pesquisadores. Para ajudá-lo(a) a começar, criamos APIs para facilitar muito o download do volume de conteúdo que você normalmente deseja extrair e em uma linguagem programática. Usar uma API permite que você:
Seja mais eficiente: O rastreamento da Web é um método ineficiente para coletar grandes quantidades de conteúdo e, usando nossas APIs, é possível acessar e fazer o download dos dados de que necessita de forma rápida e fácil.
Recupere seus dados em um formato melhor: A Elsevier converte nossos artigos de periódicos e capítulos de livros em XML, que é o formato preferido pelos mineradores de texto.
Garanta a consistência: Com mais de 2 milhões de artigos e capítulos de livros disponíveis, é importante que os(as) mineradores(as) sejam capazes de identificar as partes principais que desejam extrair. Nossa API fornece um formato congruente para todos os dados disponíveis, facilitando a execução e o teste de suas ferramentas.
Want to mine across different publishers?
Deseja extrair dados de diferentes editoras?
Ao iniciar a mineração de texto, você inevitavelmente desejará fazer isso em vários periódicos publicados por diferentes editoras. Isso representa um problema logístico. Para facilitar a mineração de texto, oferecemos suporte ao serviço crossref TDM. Esse serviço gratuito fornece a API de metadados do crossref, que pode ser usada para acessar o texto completo do conteúdo identificado pelos DOIs do crossref nos sites das editoras.
Testando suas ferramentas TDM
A mineração de texto é baseada no uso de ferramentas de processamento de linguagem natural (PLN). Para desenvolver e refinar as ferramentas de PNL que funcionarão especificamente na literatura acadêmica, criamos um corpus de artigos de acesso aberto. Ele pode ser útil para você testar e refinar suas ferramentas.
Aprendizado e suporte
Descubra como você pode acessar e usar a mineração de texto para dar suporte a seu próximo projeto de pesquisa:
To get started go to our developers portal abre em uma nova guia/janela
Learn more about how to text mine using our full text API abre em uma nova guia/janela
For further details about accessing Elsevier content see our text and data mining policy
See our FAQs for details about how to register for the API and share and/or use your TDM corpus
To access and mine content from other publishers please see CrossRef Text and Data mining services abre em uma nova guia/janela
For commercial text mining of Elsevier content see our professional R&D services text mining solutions