分享一个火车浏览器脚本插件python中文分词
  • 分享一个火车浏览器脚本插件python中文分词

  • 来源:
  • 时间:2017-03-03
  • 下载链接:
  • 状态:
  • 费用:10

最近在采集一批信息,发现火车浏览器的自带分词插件,分词效果不是很理想,在网上找了一个API分词接口:pullword
其实对于火车浏览器脚本插件用PHP和python都可以写,之前做了一个PHP分词插件见:http://www.zongk.com/zongkdown/66.html
最近一直在学习Python就用Python做了一个分词插件
下面直接附上代码和源文件:
#coding:utf-8
import sys,importlib,urllib.request
from urllib import parse
import json

if len(sys.argv)!= 2:
    print(len(sys.argv))
    print("命令行参数长度不为1")
    sys.exit()
else:
    SerializerStr = parse.unquote(sys.argv[1])
    if (SerializerStr[0:2] != '''{"'''):
        file_object = open(SerializerStr)
        try:
            SerializerStr = file_object.read()
            SerializerStr = parse.unquote(SerializerStr)
        finally:
            file_object.close()
    PluginArray = json.loads(SerializerStr)
    PluginTag=PluginArray['_Args']
    #以下是用户编写代码区域
    #print(str(PluginArray))
    myurl = "http://api.pullword.com/get.php"
    myword  = PluginArray['keyword']
    source = urllib.request.quote(myword.encode('utf-8'))
    param1 = '0.5'
    param2 = '0'
    mygeturl = myurl+"?source="+source+"&param1="+param1+"&param2="+param2
    a = urllib.request.urlopen(mygeturl)
    res = a.read().decode('utf-8')
    res1 = res.replace("\r\n","|").replace("||","")
    PluginArray['keyword'] = res1
    #print(str(res))
    #以上是用户编写代码区域
    PluginArray = json.dumps(PluginArray)
    print(PluginArray)
分词插件截图如下:

分享一个火车浏览器脚本插件python中文分词
火车浏览器插件PYthon分词插件源文件下载:

链接: http://pan.baidu.com/s/1mhVfkQc 密码: bp82

本地下载:

分享一个火车浏览器脚本插件python中文分词
文件类型: .zip 6ba6c5304c9a92e96a68e15f93ac9420.zip (907 Bytes)

TAGS:python , 中文分词 , 火车浏览器 , 脚本插件

来自Davids zhou博客原创文章请尊重作者:http://www.zongk.com/zongkdown/70.html转载请标注此链接

你可能需要
七日热点
热力推荐
网站统计
文章总数:138
今天发布:0
软件资源数:20