Modelos Word2Vec

Word2vec é um dos embeddings de palavras mais populares. Baseado em redes neurais e criado por Tomas Mikolov em 2013, o objetivo e a utilidade do Word2vec é agrupar os vetores de palavras semelhantes no espaço vetorial. Isto é, detectar, matematicamente, semelhanças. Dessa forma, o método é capaz de capturar o contexto de uma palavra em um documento e descrever o relacionamento entre palavras de um vocabulário, bem como semelhanças semânticas e sintáticas presentes no corpus textual.

Modelo
Corpora Kaggle
CBOW 100 dimensões
CBOW 200 dimensões
CBOW 300 dimensões

Modelos Word2Vector - TensorBoard

No aprendizado de máquina, para melhorar algo, muitas vezes você precisa ser capaz de medi-lo. O TensorBoard é uma ferramenta para fornecer as medições e visualizações necessárias durante o fluxo de trabalho de aprendizado de máquina. Permite rastrear métricas de experimentos como perda e precisão, visualizar o gráfico do modelo, projetar incorporações em um espaço dimensional mais baixo e muito mais.

CBOW 50 dimensões