问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
你好,欢迎来到懂视!登录注册
当前位置: 首页 - 正文

python统计文本有多少个单词(2023年最新分享)

发布网友 发布时间:2024-09-06 02:45

我来回答

1个回答

热心网友 时间:2024-11-01 20:20

导读:今天首席CTO笔记来给各位分享关于python统计文本有多少个单词的相关内容,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!

如何用python统计一个txt文件中各个单词出现的次数

1、首先,定义一个变量,保存要统计的英文文章。

2、接着,定义两个数组,保存文章中的单词,以及各单词的词频。

3、从文章中分割出所有的单词,保存在数组中。

4、然后,计算文章中单词的总数,保存在变量中。

5、用for循环,统计文章中各单词的词频。

6、最后,输出文章中各单词的词频。

7、运行程序,电脑会自动统计输入文章中各单词的词频。

python统计个单词数目

楼上的程序存在诸多问题,如没有处理标点,文件读取方法错误等。

请问楼主要区分大小写吗?如果区分的话,就按照下面的来:

importre

defget_word_frequencies(file_name):

dic={}

txt=open(filename,'r').read().splitlines()

#下面这句替换了除了'-'外的所有标点,因为'-'可能存在于单词中。

txt=re.sub(r'[^\u4e00-\u94a5\w\d\-]','',txt)

#替换单独的'-'

txt=re.sub(r'-','',txt)

forlinein:

forwordinline.split():

#如果不区分大小写,那就一律按照小写处理,下面那句改为dic.setdefault(word.lower(),0)

dic.setdefault(word,0)

dic[word]+=1

printdic

if__name__='__main__':

get_word_frequencies('test.txt')

有问题继续追问吧

用python统计一段文本中单词出现的次数

python有个特别简单的方法就可以实现,直接用str的count方法就可以了,如下

python统计字符串中单词数量

使用比较基本的方法写的参考代码:

#!/usr/bin/env?python

#??-*-?coding:?utf-8?-*-

#python?2.7

import?re

print?u'请输入字符串:'

wz?=?raw_input()

s?=?wz.lower()

#小写单词的正则表达式

r='[a-z]+'

#找到所有单词

ws?=?re.findall(r,s)

#定义一个字典来存储单词和次数

dt?=?{}

for?w?in?ws:

dt[w]?=?dt.setdefault(w,0)+1

#wd来存储单词集合,可能有几个,比如2个单词,都出现30次

wd?=?[]

#max用来存储单词出现的最多的次数

max?=?0

for?word,times?in?dt.items():

if?timesmax:

wd?=?[]

wd.append(word)

max?=?times

elif?times?==?max:

wd.append(word)

print?u'有%s个单词,出现频率最高:'%len(wd)

for?x?in?wd:

print?"%s\t%s"%(x,max)

测试

请输入字符串:

A?good?beginning?makes?a?good?ending!!!

有2个单词,出现频率最高:

a???????2

good????2

python,字符串怎么统计单词个数

如果你是指一串单词,空格隔开的,统计词频,就用列表和字典来。

比如输入的是这样:thisoneokthisonetwothreegoendatend

dic1={}

n=input().split()

foriinn:

缩进ifiindic1:dic1[i]+=1

缩进else:dic1[i]=1

print(dic1)

python中怎么样统计一篇文章中的单词个数

你好,楼主,可以使用字符串的统计函数来完成。

详细代码如下:

w='python,我爱python,hellopython。'

print("python出现了%s次"%w.count('python'))

结语:以上就是首席CTO笔记为大家整理的关于python统计文本有多少个单词的全部内容了,感谢您花时间阅读本站内容,希望对您有所帮助,更多关于python统计文本有多少个单词的相关内容别忘了在本站进行查找喔。

声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
古天乐的资料!!! 胆结石可以喝柠檬蜂蜜水吗 柠檬对结石有什么作用 胆结石可以吃柠檬吗 江西有哪些风景 行政处罚对象能不能是分公司 分公司是否能作为被行政处罚的对象 分享20份亚马逊运营过程中常用邮件回复模板 2024年上半年自考报名时间 22年辽宁省自考延期怎么退费 牛肉炒芥蓝有哪些烹饪方式? 什么是认缴额和出资额 虾味豆腐制作方法 挪用公款罪认定标准 挪用公款罪的公款认定是怎样的 商用小程序开发? 免费开发微信小程序(微信公众号小程序怎么做) 怎么把粥煮得粘稠一些 胡椒长在树吗 案例分析及法律规定之培训费的赔偿是怎样的? 会计师职业责任险 我喜欢他,他确深爱着他老婆,我怎么办 一个男人回答出了我老婆你是我深爱过女人是什么意思? u盘怎么格式化成ntfs格式 用u盘装win7系统时怎么设置格式为ntfs 怎么样把U盘格式化成NTFS格式呢? 如何将U盘转换为NTFS格式? 怎么把u盘设置成ntfs格式? 鸭肉煲汤怎么做 鸭肉煲汤的做法 老鸭家常做法 统计某个字出现多少次python(2023年最新解答) 统计出现了多少次python(统计一个数出现的次数) 来草原旅游适合发的朋友圈句子 海带糖水的做法和配方海带糖水怎么做 《吹落的树叶》结局是如何的 吹落的树叶大结局 绿豆仁海带百合糖水做法 吹落的树叶讲的什么 python有多少个单词(2023年最新解答) 人渣反派自救指南第二季 洛冰河洗裤子的梦是哪一章 2023年哪些行业最赚钱且前景广阔? 滴滴打车未付款是否会影响个人征信? 滴滴长时间不付款会有影响吗 耳屎多了怎么弄出来 怎样掏耳朵深处的耳屎 耳朵里的耳屎掏不出来怎么办 洛阳周边漂流哪个最好玩 洛阳周边漂流好玩的地方推荐 基层法律服务工作者点到成绩复核会不会成绩变少 延庆县八达岭特区办事处领导班子
  • 焦点

最新推荐

猜你喜欢

热门推荐