开发语言:golang,php
适用语言:中文
golang三方库:sego中文分词(原始分词词库)
目的:新建专题需要推荐相关内容与推荐相关专题需求计算
测试连接:http://www.zongk.com/myextend/mycos.php?worda=大眼睛猫头鹰&wordb=猫头鹰
API接口:http://www.zongk.com/myextend/mycos.php
请求方式:GET
请求参数:
worda:关键词1(字符串)
wordb:关键词2(字符串)
返回值:相似值(最大1,最小0)
余弦计算相似度:
余弦相似度算法是什么意思?以及他的教程,就不长篇累述了, 可以自己百度一下具体原理计算公式(我是看不懂,只能皮毛),这里推荐两篇文章:
1、公司大数据同时推荐《余弦相似度 | 文本分析:基础》
2、还有一个自己百度的觉得不错,主要是实际计算公式那块《自己实现文本相似度算法(余弦定理)》
计算思想简述:
章节1中出现的字为:Z1c1,Z1c2,Z1c3,Z1c4……Z1cn;它们在章节中的个数为:Z1n1,Z1n2,Z1n3……Z1nm;
章节2中出现的字为:Z2c1,Z2c2,Z2c3,Z2c4……Z2cn;它们在章节中的个数为:Z2n1,Z2n2,Z2n3……Z2nm;
其中,Z1c1和Z2c1表示两个文本中同一个字,Z1n1和Z2n1是它们分别对应的个数,
计算公式:
来自Davids zhou博客原创文章请尊重作者:http://www.zongk.com/zongk/135.html转载请标注此链接
Davids zhou | 站点地图 | | | 皖ICP备14017762号 如有侵犯您权利点击上面QQ -Powered By 帝国CMS -davids.zhou#qq.com(#换@)
Davidszhou个人博客主要记录在网站建设、SEO优化、python开发、PHP开发中遇到问题记录保存,作为他人参考学习教程