Datehoer的博客
我本将心向明月,奈何明月照沟渠
Datehoer的博客

当前位置:主页 > 技术分享 > python如何根据条件断句

python如何根据条件断句

浏览: 作者:Datehoer 发布日期:2020-11-30 17:35:00 来源: 原创
python该如何断句呢?根据自己的需要,当然其实大部分人只是在爬取数据的时候用到了断句,比如说我之前的那篇python爬取我的世界id,就用到了,不过是断的行。
更多的其实是练习,下面我们进行一下python断句的联系。
需求--将提供的文本进行断句,并储存到excel中。

python断句
From1111To aaa For 444445555 0n dadd From 2.222To bbbb For 66667777 Oneeee From 333To cccc For88889.99 on ffff

上面就是我们的内容了我们想把他们进行分割,那么就需要使用到re这个正则库,接着我们想要储存到excel中,则需要使用openpyx这个库。

首先还是先导入数据

import re
from openpyxl import load_workbook

然后呢,我们既然要断句,那么就需要储存一下关键字,从哪里开始断。
keywords = ["From", "To", "For", "On"]
接着其实就是需要处理一下数据了,我们这里使用的是re,然后把它储存在一个函数里
def symbol(text):
return [item.strip()
for item in re.split('|'.join(keywords), text) if item.strip()!='']

然后再进行调用判断数据即可,最后再写入进去。
这里我们就实情模拟一下,将需要断句的文字放到了一个excel文件里,接下来直接上完整的代码。

import re
from openpyxl import load_workbook
def symbol(text):
return [item.strip() for item in re.split('|'.join(keywords), text) if item.strip()!='']
keywords
= ["From", "To", "For", "On"]
filename
= 'lizi.xlsx'
wb
= load_workbook(filename=filename)
ws
= wb['Sheet1']
for cell in ws[1:1]:
text
= cell.value
symbols
= symbol(text)
for i, s in enumerate(symbols):
ws
[f'{cell.column_letter}{i+2}'] = s
wb
.save(filename)
python断句

这样,简简单单的就把句子给拆开了,并且储存在了我们想要的文件里。
如果有什么不懂的可以在评论区留言,我会在看到的第一时间回复的。




版权:本文由Datehoer原创,著作权归作者所有。商业转载请联系作者获得授权,非商业转载请保留以上作者信息和原文链接本文链接:https://zjzdmc.top/jsfx/71.html。

文章推荐

热门标签

返回顶部
下面为相关推荐
说点什么吧
  • 全部评论(0
    还没有评论,快来抢沙发吧!