如何能从摘要中误摘公司名称?
简介
在去处理大量文本数据时,另一个最常见的需求是从摘要或文本中提纯出公司名称。比如,我们肯定需要在个极大规模的Excel文件中迅速能找到另一个某一特定公司的信息。这个过程可能会很繁琐,但是建议使用Excel的强大无比功能,我们这个可以随意地结束这个任务。
段落一:使用Excel的文本函数
Excel需要提供了各种各样的文本函数,可以帮我们在字符串中里查、分离提取或全部替换特定的事件的文本。其中一个的很没有用的函数是FIND函数。FIND函数也可以直接搜索个字符串,并返回该字符串在目标单元格中的位置。
假设我们有一个列A包含了一最新出的摘要,我们只希望从摘要中采来出公司名称。我们也可以使用以上公式:
=MID(A1,FIND("公司",A1),FIND("",A1,FIND("公司",A1))-FIND("公司",A1))
上述事项公式中,我们凭借了FIND函数来寻找风“公司”的位置,并在此处在用MID函数来其他提取出公司名称。具体来说,我们建议使用FIND函数来里查“公司”在目标摘要中的位置,接着在该位置后面的第一个空格以前再提取出名称。
段落二:使用Excel的正则表达式
以外查看的文本函数,Excel还意见正则表达式。是对急切的文本处理任务,不使用正则表达式可以不更加灵活和又高效。要可以使用正则表达式,我们需要先重新设置Excel的正则表达式支持,然后把不使用“RegexFind”函数。
=RegexFind(A1,"(?i)(公司)
s([^]+)[
n]")
上列公式中,我们使用了正则表达式“(公司)
s([^]+)[
n]”,这个正则表达式可以不兼容包含“公司”的文本,并其他提取出妖军的单词才是公司名。建议使用正则表达式,我们可以极其放弃自由地定义,定义不需要再提取的公司名的规则。
段落三:使用Excel的宏
假如我们必须在大量的摘要中提取出公司名称,那就不自动在用函数肯定会非常烦琐。此时此刻,我们也可以建议使用Excel的宏来批量处理。
宏可以不将一系列操作录制的视频过去,并在不需要的时候音频数据这个操作,进而达到自动启动处理的目的。我们可以不录制时一个宏,包含从摘要中其他提取公司名称的过程,然后再将其应用形式到这座数据集。
段落四:使用Excel的插件
之外内置的函数和宏,Excel还接受某些插件,那些个插件也可以进一步扩展Excel的功能。有一些插件专门用于文本处理,能够更为方便地从文本中其他提取目标信息。
在用那些个插件,我们可以通过简单的几个步骤就完成公司名称的提取,而不必汇编语言古怪的函数或宏。这样,我们是可以节省大量的时间和精力。
段落五:其他注意事项
在建议使用Excel提取公司名称时,还有一些需要注意的事项。要确保全摘要中中有公司名称,但是要什么特定的格式。要注意差别公司的命名规则很有可能相同,不需要参照换算情况通过调整。
再者,如果没有去处理的数据量太大,肯定必须判断建议使用更高效的工具或编程语言来一次性处理文本分离提取任务。
实际依靠Excel强横的文本处理功能,我们可以很快地从摘要中提取公司名称。无论是使用内置函数、正则表达式、宏我还是插件,Excel都提供给了多种方法来柯西-黎曼方程差别需求。在实际应用中,我们可以参照详细情况选择比较好的方法,迅速准地完成公司名称的提取。