词频统计
文本来源:https://pan.baidu.com/s/1o75GKZ4
path = r'C:UsersAdministratorPycharmProjectsuntitled1Walden.txt'
with open(path,'r',encoding='utf8 ') as text:
words = text.read().split()
print(words)
for word in words:
print('{}-{} times'.format(word,words.count(word)))
结论:
有一些带标点符号的单词被单独统计了次数; 有些单词不止一次地展示了出现的次数; 由于Python对大小写敏感,开头大写的单词被单独统计了。现在我们根据这些点调整一下我们的统计方法。对单词做一些预处理:
mport string
path = r'C:UsersAdministratorPycharmProjectsuntitled1Walden.txt'
with open(path,'r',encoding='utf8 ') as text:
words = [raw_word.strip(string.punctuation).lower() for raw_word in text.read().split()]
words_index = set(words)
counts_dict = {index:
相关知识
统计学习理论及应用
关注公众号,有单词发音哦,【A阶段A+5】
跑宝宝环最全面的积分规则及数据统计
Kaggle宠物收养比赛亚军复盘
宠物行业的统计与趋势:在线零售商如何掘金“
我国宠物食品消费状况的统计调查研究.docx
原创 如何让猫活得更久?猫咪死亡原因和寿命统计
宠物行业的统计与趋势:在线零售商如何掘金“铲屎官市场”?
2024年5月农业农村部核发宠物食品进口饲料登记证统计情况
2021年最新的国内外宠物展会统计来啦!
网址: 词频统计 https://www.mcbbbk.com/newsview195601.html
上一篇: 我的数据结构学习之路(一) |
下一篇: 魔兽世界全版本GM命令全集 |
推荐分享

- 1我的狗老公李淑敏33——如何 5096
- 2南京宠物粮食薄荷饼宠物食品包 4363
- 3家养水獭多少钱一只正常 3825
- 4豆柴犬为什么不建议养?可爱的 3668
- 5自制狗狗辅食:棉花面纱犬的美 3615
- 6狗交配为什么会锁住?从狗狗生 3601
- 7广州哪里卖宠物猫狗的选择性多 3535
- 8湖南隆飞尔动物药业有限公司宠 3477
- 9黄金蟒的价格 3396
- 10益和 MATCHWELL 狗 3352