Python 带你走进哈利波特的魔法世界
先简单介绍一下jieba中文分词包,jieba包主要有三种分词模式:
精确模式:默认情况下是精确模式,精确地分词,适合文本分析;
全模式:把所有能成词的词语都分出来, 但是词语会存有歧义;
搜索引擎模式:在精确模式的基础上,对长词再次切分,适合用于搜索引擎分词。
jieba 包常用的语句:
精确模式分词:jieba.cut(text,cut_all = False),当cut_all = True时为全模式
自定义词典:jieba.load_userdict(file_name)
增加词语:jieba.add_word(seg,freq,flag)
删除词语:jieba.del_word(seg)
《哈利·波特》是英国作家J·K·罗琳的奇幻文学系列小说,描写主角哈利·波特在霍格沃茨魔法学校7年学习生活中的冒险故事。下面将以《哈利波特》错综复杂的人物关系为例,实践一下jieba包。
经过初次分词之后,我们发现大部分的词语已经ok了,但是还是有小部分名字类的词语分得不精确,比如说'布利'、'罗恩说'、'伏地'、'斯内'、'地说'等等,还有像'乌姆里奇'、'霍格沃兹'等分成两个词语的。
再次分词之后,我们可以看到在初次分词出现的错误已经得到修正了,接下来我们统计分析。
整部小说出现最多的词语TOP15中出现了哈利、赫敏、罗恩、邓布利多、魔杖、魔法、马尔福、斯内普和小天狼星等字眼。
我们自己串一下,大概可以知道《哈利波特》的主要内容了,就是哈利在小伙伴赫敏、罗恩的陪伴下,经过大法师邓布利多的帮助与培养,利用魔杖使用魔法把大boss伏地魔k.o的故事。当然啦,《哈利波特》还是非常精彩的。
整部小说按照出场次数,我们发现哈利作为主角的地位无可撼动,比排名第二的赫敏远超13000多次,当然这也是非常正常的,毕竟这本书是《哈利波特》,而不是《赫敏格兰杰》。
处理之后,我们发现同一个人物出现了不同的称呼,因此合并并统计,得出88个节点。
有了节点node以及边edge后,通过gephi对《哈利波特》的人物关系进行分析:
节点的大小表示人物的出场次数,线的粗细表示人物之间的交往关系
相关知识
哈利波特展会
【哈利波特魔法觉醒】4
[哈利波特个人简介] 哈利波特人物介绍详细
哈利波特魔法觉醒宠物怎么共鸣 哈利波特魔法觉醒宠物共鸣小技巧
哈利波特和福尔摩斯灵感诞生的地方,走进世界第一座文学之都
哈利波特宠物
哈利波特之炼金术师
哈利波特魁地奇锦标赛多少钱 哈利波特魁地奇锦标赛价格一览
《哈利波特魔法觉醒》混血猫狸子宠物获取攻略大全
《哈利·波特》里的猫头鹰居然是个呆萌小鸟?盘点魔法世界的猫头鹰
网址: Python 带你走进哈利波特的魔法世界 https://www.mcbbbk.com/newsview845385.html
上一篇: 哈利波特的宠物叫什么 |
下一篇: 哈利波特魔法觉醒宠物彩蛋怎么获得 |
推荐分享

- 1我的狗老公李淑敏33——如何 5096
- 2南京宠物粮食薄荷饼宠物食品包 4363
- 3家养水獭多少钱一只正常 3825
- 4豆柴犬为什么不建议养?可爱的 3668
- 5自制狗狗辅食:棉花面纱犬的美 3615
- 6狗交配为什么会锁住?从狗狗生 3601
- 7广州哪里卖宠物猫狗的选择性多 3535
- 8湖南隆飞尔动物药业有限公司宠 3477
- 9黄金蟒的价格 3396
- 10益和 MATCHWELL 狗 3352