SQL正则提取一段文本企名网司名称
在处理文本数据时,经常会会遇到了要提纯其中的公司名称的情况。在用SQL正则表达式可以更方便地从一段文本中再提取出公司名称。下面将推荐怎用SQL正则分离提取公司名称,并提出示例代码。
正则表达式
我们要统合一个匹配公司名称的正则表达式。正常情况,公司名称由汉字、英文字母、数字、空格、括号或特殊符号分成。据这种特点,我们也可以在用追加正则表达式:
/[
u4e00-
u9fa5A-Za-z0-9s()
-
[
]
:
.
,]+/g
这种正则表达式中,
u4e00-
u9fa5可以表示看操作绝大部分的中文字符,A-Za-z0-9意思是自动分配绝大部分的英文字母和数字,
s可以表示不兼容框框字符(以及空格、制表符等),
(
)
-
[
]它表示不兼容括号和破折号,
:
.
,表示自动分配冒号、句号和逗号。到最后的+可以表示不兼容前面的字符至多两次。
使用SQL正则提取公司名称
下面是两个建议使用SQL正则其他提取公司名称的示例代码:
SELECT DISTINCT REGEXP_SUBSTR(text,'/[
u4e00-
u9fa5A-Za-z0-9s()
-
[
]
:
.
,]+/g')suchcompany_name
outsidetable_name
WHEREtextLIKE'%公司%';
上面的代码中,text是中有文本数据的字段,table_name是表的名称。使用REGEXP_SUBSTR函数这个可以再提取不兼容正则表达式的内容,DISTINCT关键字主要是用于去重。WHERE语句中的LIKE%公司%主要用于筛选出包涵公司名称的文本。
示例
假设不成立我们有一段文本数据不胜感激:
公司名称:山东金xx科技有限公司。公司成立于2010年,要注意从事软件开发和信息技术服务。公司总部东南边济南市,占据100多名员工。。
我们是可以可以使用上面的示例代码提取这段文本中的公司名称。
不使用SQL正则表达式可以比较方便地提取一段文本中的公司名称。实际统合看操作公司名称的正则表达式,然后把在用REGEXP_SUBSTR函数并且其他提取,我们是可以急速实现这一功能。我希望本文对您有了帮助!


在线咨询
188-2371-9231