snrg.net
当前位置:首页 >> python打开一个txt文件以后如何将标点去掉,并将剩... >>

python打开一个txt文件以后如何将标点去掉,并将剩...

import ref = open('word.txt','r')word = f.read()f.close()# ------- 1 -------wList1 = []word1 = word.split(',')for i in word1:wList1.append(i.lower())wLen1 = len(wList1)print 'number of word:', wLen1, '\n', wList1# ------- 2 ---...

删除文本中的标点示例。供参考。# coding:UTF-8f=open('e:/python27/biaodian.txt','r')lines=f.readlines()f.close()# 以下新建的文件中只保留英文字母和数字# 仍按原始的行结构存储chardigit='ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrst...

标点有很多。。 (逗号,分好,句号,感叹号,问好) 都要分么。。 如果都要分,就用re模块的split 如果只按一种分,直接用split函数

我的理解是 python’s的“ ’ ”也是字符 ,和标点符号一样。你只要把去除的字符都加到正则表达式的括号中就可以了。 ,所以: import re r='[’!"#$%&\'()*+,-./:;?@[\\]^_`{|}~]+' line=re.sub(r,'',"python’s") print line

isalpha() #是否全是字母,并至少有一个字符 如果是非中文的东西可以用此函数,循环判断每一个字符,将不是字母的去掉 如果是中文的话要判断中文 ,这个不怎么好办,需要用到正则表达式

f=open('filename','r') line=f.read().split('标点') for i in line: $DO what you wanna

先转成unicode,然后判断每个字符是不是标点,如果是,判断后面一个字符是不是,两个条件都满足就把后面的删掉吧

根据已有的研究结果,可以将义务教育生物学课程所涵盖的知识分为生物学事实、概念和原理。对于公民科学素养的提升和构成而言,生物学概念和原理更加重要。因此,初中生物学课程标准修订后的一个重要变化就是在课程内容中突显了重要概念的传递。

import rea='asdas,ad,ad.adasd,adq,eqasdad!adas@asd#asdsa$adasd%adsa&asd'print re.sub('[^a-zA-Z0-9]',"",a)

#!/usr/bin/python #Filename: user_input_1.py #Function: to check whether the string is palindrome or not. Ignore space(空格), case(大小写) and punctuation(标点符号). #Test string: "Rise to vote,sir." import string def reverse(t...

网站首页 | 网站地图
All rights reserved Powered by www.snrg.net
copyright ©right 2010-2021。
内容来自网络,如有侵犯请联系客服。zhit325@qq.com