Ir para o conteúdo principal

Infelizmente, não oferecemos suporte total ao seu navegador. Se for possível, atualize para uma versão mais recente ou use o Mozilla Firefox, o Microsoft Edge, o Google Chrome ou o Safari 14 ou mais recente. Se não conseguir e precisar de suporte, envie seu feedback.

Gostaríamos de receber seu feedback sobre essa nova experiência.Diga-nos sua opinião abre em uma nova guia/janela

Elsevier
Publique conosco

Mineração de dados e texto

Encontre a melhor maneira de fazer o download, pesquisar, filtrar e compreender milhões de artigos e livros publicados na ScienceDirect. Todos os livros e periódicos da Elsevier permitem mineração de dados e texto (TDM). Descubra mais hoje.

Fundamentos de TDM

Por que usar artigos acadêmicos?

Artigos e livros publicados já contêm as informações que você pode estar procurando e a mineração de texto é a maneira ideal de desbloquear esse conhecimento. Artigos e capítulos de livros também são selecionados e constituem uma fonte confiável de informações e, o que é mais importante, há uma grande quantidade deles em todas as disciplinas, desde o primeiro artigo publicado.

Guia de introdução

A mineração de texto exige que, em primeiro lugar, você acesse e faça o download do conteúdo que deseja analisar e, em seguida, execute ferramentas especiais de mineração de texto sobre esse conteúdo para encontrar o que está procurando. Nossa interface de programação de artigo de texto completo (API) é uma maneira fácil e simples para fazer o download em massa do conteúdo da Elsevier para fins de mineração de texto para pesquisa não comercial. É possível obter acesso à API de texto completo em nosso portal de desenvolvedores. Nossa API inclui conteúdo de acesso aberto, mas também é possível extrair esse conteúdo usando a função de recuperação DOI https://api.elsevier.com/content/article/doi/[DOI] na qual seu script automatizado pode ser executado.

Por que usar uma API?

A mineração de texto requer muitas ferramentas e recursos diferentes para funcionar, além de várias contribuições qualificadas dos pesquisadores. Para ajudá-lo(a) a começar, criamos APIs para facilitar muito o download do volume de conteúdo que você normalmente deseja extrair e em uma linguagem programática. Usar uma API permite que você:

  • Seja mais eficiente: O rastreamento da Web é um método ineficiente para coletar grandes quantidades de conteúdo e, usando nossas APIs, é possível acessar e fazer o download dos dados de que necessita de forma rápida e fácil.

  • Recupere seus dados em um formato melhor: A Elsevier converte nossos artigos de periódicos e capítulos de livros em XML, que é o formato preferido pelos mineradores de texto.

  • Garanta a consistência: Com mais de 2 milhões de artigos e capítulos de livros disponíveis, é importante que os(as) mineradores(as) sejam capazes de identificar as partes principais que desejam extrair. Nossa API fornece um formato congruente para todos os dados disponíveis, facilitando a execução e o teste de suas ferramentas.

Want to mine across different publishers?

Deseja extrair dados de diferentes editoras?

Ao iniciar a mineração de texto, você inevitavelmente desejará fazer isso em vários periódicos publicados por diferentes editoras. Isso representa um problema logístico. Para facilitar a mineração de texto, oferecemos suporte ao serviço crossref TDM. Esse serviço gratuito fornece a API de metadados do crossref, que pode ser usada para acessar o texto completo do conteúdo identificado pelos DOIs do crossref nos sites das editoras.

Crossref logo

Testando suas ferramentas TDM

A mineração de texto é baseada no uso de ferramentas de processamento de linguagem natural (PLN). Para desenvolver e refinar as ferramentas de PNL que funcionarão especificamente na literatura acadêmica, criamos um corpus de artigos de acesso aberto. Ele pode ser útil para você testar e refinar suas ferramentas.

Captura de tela do corpus STM de acesso aberto

Aprendizado e suporte

Descubra como você pode acessar e usar a mineração de texto para dar suporte a seu próximo projeto de pesquisa: