Recently Published
Guía_ShinyApp_desde_Cero
Guía_ShinyApp_desde_Cero
R_tips_quarto发布到github
记录如何使用quarto创建个人知识图书,并将其发布到github的静态网页
De Word Embeddings a la Similitud Semántica
Las representaciones BoW y TF-IDF son vectores dispersos que codifican únicamente frecuencias de aparición, sin capturar ninguna relación semántica entre términos. Dos palabras sinónimas como “nave” y “barco” tendrán vectores ortogonales en TF-IDF aunque signifiquen lo mismo. Los embeddings, en cambio, son vectores densos de baja dimensión entrenados para que palabras con contextos similares queden cerca en el espacio vectorial: la distancia entre vectores refleja similitud de significado, no de forma superficial. Esto permite detectar analogías, sinonimia y relaciones conceptuales imposibles de capturar con conteos