当前位置:   article > 正文

python对excel筛选提取文本中数字_使用Python&NLP,如何从具有大量自由文本的Excel列中提取特定的文本字符串和字符串前面的相应数字?...

python 取excel列中某个字符前的内容

我对Python比较陌生,对NLP(和nltk)也很陌生,我在网上搜索过指导,但没有找到完整的解决方案。不幸的是,我一直在玩的稀疏代码是在另一个网络上,但我包括一个示例电子表格。我想得到建议的简单英语步骤(比我下面有更详细的),这样我可以首先尝试自己用python3编写脚本。除非你能简单地帮助你编写脚本。。。那样的话,谢谢你。在

问题:一个健壮的电子表格中有几列是非常无结构的,其中有500-5000个英文字符可以讲述一个故事。我需要通过提取可量化的数据使其更具结构化。我需要:

1)在用户提供的非结构化自由文本列中搜索字符串(用户输入列标题)(我认为我做得对)

2)将该字符串作为Excel中新的列标题(我想我做得对)

3)抓住绳子前的号码(这就是我卡住的地方)。正如您在表格中看到的,有时数字和文本之间没有空格,当然,有时也会出现拼写错误)

4)将该数字放入同一行的新列中(尚未进入此步骤)

我将不得不对多个关键字重复这样做,但我相信,我可以用一个循环或其他东西来解决这个问题。非常感谢您的时间和专业知识。。。在

E9q4Z.jpg

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Cpp五条/article/detail/366412
推荐阅读
相关标签
  

闽ICP备14008679号