Tutorial de PNL: Modelado de temas en Python con BerTopicpor@davisdavid
36,707 lecturas

Tutorial de PNL: Modelado de temas en Python con BerTopic

2021/08/24
5m
por @davisdavid 36,707 lecturas
tldt arrow
ES
Read on Terminal Reader
Read this story w/o Javascript

Demasiado Largo; Para Leer

BerTopic es una técnica de modelado de temas que utiliza transformadores (incrustaciones BERT) y TF-IDF basado en clases para crear clústeres densos. También te permite interpretar y visualizar fácilmente los temas generados. En este tutorial de PNL, utilizaremos los Tweets de los Juegos Olímpicos de Tokio 2020 con el objetivo de crear un modelo que pueda clasificar automáticamente los tweets por sus temas. El algoritmo BerTopic contiene 3 etapas: Incrustar los datos textuales (documentos) Incrustar los documentos con BERT, o puede usar cualquier otra técnica de incrustación. El algoritmo utiliza UMAP para reducir la dimensionalidad de las incrustaciones y la técnica HDBSCAN.

Company Mentioned

Mention Thumbnail
featured image - Tutorial de PNL: Modelado de temas en Python con BerTopic
Davis David HackerNoon profile picture

@davisdavid

Davis David

react to story with heart

HISTORIAS RELACIONADAS

L O A D I N G
. . . comments & more!