python该如何断句呢?根据自己的需要,当然其实大部分人只是在爬取数据的时候用到了断句,比如说我之前的那篇
python爬取我的世界id
,就用到了,不过是断的行。更多的其实是练习,下面我们进行一下python断句的联系。
需求--将提供的文本进行断句,并储存到excel中。

<caption> python断句 </caption>
From1111To aaa For 444445555 0n dadd From 2.222To bbbb For 66667777 Oneeee From 333To cccc For88889.99 on ffff

上面就是我们的内容了我们想把他们进行分割,那么就需要使用到re这个正则库,接着我们想要储存到excel中,则需要使用openpyx这个库。
首先还是先导入数据
import re from openpyxl import load_workbook
然后呢,我们既然要断句,那么就需要储存一下关键字,从哪里开始断。
keywords = ["From", "To", "For", "On
接着其实就是需要处理一下数据了,我们这里使用的是re,然后把它储存在一个函数里
def symbol(text): return [item.strip() for item in re.split('|'.join(keywords), text) if item.strip()!='']
然后再进行调用判断数据即可,最后再写入进去。

这里我们就实情模拟一下,将需要断句的文字放到了一个excel文件里,接下来直接上完整的代码。
import re from openpyxl import load_workbook def symbol(text): return
[item.strip() for item in re.split('|'.join(keywords), text) if item.strip()!='']
keywords = ["From", "To", "For", "On"] filename = 'lizi.xlsx' wb = load_workbook(filename=filename)
ws = wb['Sheet1'] for cell in ws[1:1]: text = cell.value symbols = symbol(text)
for i, s in enumerate(symbols): ws[f'{cell.column_letter}{i+2}'] = s wb.save(filename)

python断句
这样,简简单单的就把句子给拆开了,并且储存在了我们想要的文件里。
如果有什么不懂的可以在评论区留言,我会在看到的第一时间回复的。

最后修改:2021 年 04 月 20 日 08 : 45 AM
如果觉得我的文章对你有用,请随意赞赏