paint-brush
Tutorial de PNL: Modelado de temas en Python con BerTopicpor@davisdavid
43,873 lecturas
43,873 lecturas

Tutorial de PNL: Modelado de temas en Python con BerTopic

por Davis David5m2021/08/24
Read on Terminal Reader
Read this story w/o Javascript
tldt arrow
ES

Demasiado Largo; Para Leer

BerTopic es una técnica de modelado de temas que utiliza transformadores (incrustaciones BERT) y TF-IDF basado en clases para crear clústeres densos. También te permite interpretar y visualizar fácilmente los temas generados. En este tutorial de PNL, utilizaremos los Tweets de los Juegos Olímpicos de Tokio 2020 con el objetivo de crear un modelo que pueda clasificar automáticamente los tweets por sus temas. El algoritmo BerTopic contiene 3 etapas: Incrustar los datos textuales (documentos) Incrustar los documentos con BERT, o puede usar cualquier otra técnica de incrustación. El algoritmo utiliza UMAP para reducir la dimensionalidad de las incrustaciones y la técnica HDBSCAN.

Company Mentioned

Mention Thumbnail
featured image - Tutorial de PNL: Modelado de temas en Python con BerTopic
Davis David HackerNoon profile picture
Davis David

Davis David

@davisdavid

Data Scientist | AI Practitioner | Software Developer| Technical Writer

Sobre @davisdavid
LEARN MORE ABOUT @DAVISDAVID'S
EXPERTISE AND PLACE ON THE INTERNET.
L O A D I N G
. . . comments & more!

About Author

Davis David HackerNoon profile picture
Davis David@davisdavid
Data Scientist | AI Practitioner | Software Developer| Technical Writer

ETIQUETAS

Languages

ESTE ARTÍCULO FUE PRESENTADO EN...

Permanent on Arweave
Read on Terminal Reader
Read this story in a terminal
 Terminal
Read this story w/o Javascript
Read this story w/o Javascript
 Lite