python的包都是英文的,但有一个包里有jieba库可以将中文进行分词。

NLP(自然语言)领域现在可谓是群雄纷争,各种开源组件层出不穷,其中一支不可忽视的力量便是jieba分词,号称要做最好的 Python 中文分词组件。
“最好的”这三个字可不是空穴来风,jieba在开源社区的受欢迎程度非常之高。
jieba项目目前的github star数已经达到24k,其他热门分词组件像HanLP star数20k、ansj_seg star数5.6k、pkuseg-python star数5k。可见jieba已经稳居中文分词领域c位。
jieba的主要功能是做中文分词,可以进行简单分词、并行分词、命令行分词,当然它的功能不限于此,目前还支持关键词提取、词性标注、词位置查询等。
更让人愉悦的是jieba虽然立足于python,但同样支持其他语言和平台,诸如:C++、Go、R、Rust、Node.js、PHP、 iOS、Android等。所以jieba能满足各类开发者的需求。
据我所知,jieba最靠谱的文档是github项目的readme,因为它似乎还没有独立的使用文档。但由于使用起来简单,看readme也能快速上手。国内各大博客有关于jieba的使用教程,但需要甄别下准确度和时效性,因为jieba项目一直在更新。
Spyder是Python的IDE,很方便,您下载Anaconda并安装,Anaconda是完全免费的,包换很多Python依赖包.Anaconda带有Spyder3.0。安装完毕后在开始菜单中启动Anaconda Prompt,在其中输入spyder就可以启动了。
在import之前,你可以 import sys sys.path.append('你的module的目录‘)就可以import这个目录里的module了。
采用独立程序安装的spyder,软件自带了python环境和许多流行科学包。但和系统中安装的python是独立的,在python中pip安装的库是无法被spyder控制台调用的。
在Python中创建窗口可使用多个库,其中比较常用的是Tkinter和PyQt。要使用Tkinter创建窗口,无需安装任何新的包,因为Tkinter是Python自带的。但要使用PyQt创建窗口,需要在Python中安装PyQt库。
PyQt是一个用于创建GUI应用程序的Python库,它基于Qt框架,提供了丰富的UI组件和工具箱,可帮助用户快速构建高度定制的窗口和界面。PyQt分为两个版本:PyQt4和PyQt5,但现在PyQt5已成为官方推荐版本,因此建议使用PyQt5。
要安装PyQt5,可以使用pip命令在命令行中输入以下命令:
安装完成后即可在Python中使用PyQt5来创建窗口。