按时间归档:2018年4月19日
-
基于word2vec训练词向量(二)
作者:汪晨 一.基于Hierarchical Softmax的word2vec模型的缺点 二.Negative SampliNg模型 三.Negative Sampling优化原理…
-
中文文本相似度计算工具集
一、基本工具集 1.分词工具 a.jieba 结巴中文分词 https://github.com/fxsjy/jieba b.HanLP 自然语言处理 中文分词 词性标注 命名实体…