[golang余弦相似度]利用余弦模型计算两关键词相似度

作者:Davidszhou   来源:原创插件   时间:2020-02-23 23:04:14   点击:

开发语言:golang,php

适用语言:中文

golang三方库:sego中文分词(原始分词词库)

目的:新建专题需要推荐相关内容与推荐相关专题需求计算

测试连接http://www.zongk.com/myextend/mycos.php?worda=大眼睛猫头鹰&wordb=猫头鹰

API接口:http://www.zongk.com/myextend/mycos.php

请求方式:GET

请求参数:

worda:关键词1(字符串)

wordb:关键词2(字符串)

返回值:相似值(最大1,最小0)


 

 

余弦计算相似度:

余弦相似度算法是什么意思?以及他的教程,就不长篇累述了, 可以自己百度一下具体原理计算公式(我是看不懂,只能皮毛),这里推荐两篇文章:

1、公司大数据同时推荐《余弦相似度 | 文本分析:基础

2、还有一个自己百度的觉得不错,主要是实际计算公式那块《自己实现文本相似度算法(余弦定理)

计算思想简述:

章节1中出现的字为:Z1c1,Z1c2,Z1c3,Z1c4……Z1cn;它们在章节中的个数为:Z1n1,Z1n2,Z1n3……Z1nm;

章节2中出现的字为:Z2c1,Z2c2,Z2c3,Z2c4……Z2cn;它们在章节中的个数为:Z2n1,Z2n2,Z2n3……Z2nm;

其中,Z1c1和Z2c1表示两个文本中同一个字,Z1n1和Z2n1是它们分别对应的个数,

计算公式:

余弦相似度公式

 

TAGS:golang , 相似度 , 余弦

来自Davids zhou博客原创文章请尊重作者:http://www.zongk.com/zongk/135.html转载请标注此链接

文章推荐
七日热点
热力推荐
网站统计
文章总数:137
今天发布:0
软件资源数:20