免费起名核名

公司起名_公司起名字大全免费

工商核名

公司核名_工商核名查询系统官网
开公司想不出好名字? 企名网为您推荐
已为 家公司推荐名字
如:贵州企通达财务咨询有限公司,城市是“上海”,行业是“科技”
公司起名,需要注意哪些事项?

工商核名

非常重要,真实有效的号码才能收到核名结果

查询成功

稍后将有工作人员告知您查询结果,感谢您的耐心等待!

开源公司起名

发表日期:2022-05-30 10:25:48

研究人员并不担心有机化合物的命名不规范:Transformer是一个开源工具,可以自动为有机化合物命名

“你怎么给有机化合物命名?”、“有机化合物的命名规则是什么?”、“这种药的有效成分叫什么?”有什么软件或程序可以找到有机化合物的名称吗?以及“为软件命名是要花钱的。”、“某些软件名称不正确..”

注:知乎问题部分。

总之,有机化合物太难命名,规则太繁琐,而且没有开源软件......

人工智能能通过开发“风和水”来解决这些问题吗?

现在,来自莫斯科罗蒙诺索夫州立大学(Lomonosov State University)和Syntelly创业公司(Syntelly Startup)的研究人员开发了一种基于Transformer的人工神经方法,可以根据IUPAC命名系统生成有机化合物的名称。

它也是开源的,可以在网上找到。

我迫不及待地想在这篇文章的“使用技巧”部分体验一次在线体验。

项目地址:http://www.zhucesz.com/

IUPAC命名法是有机化合物命名的一种系统方法,在有机化学中占有重要地位。化学家通常手工创建IUPAC名称,但这个过程容易出错,需要深入理解命名规则。电脑可以缓解这个问题。化学家可以使用软件工具生成名字。

然而,目前还没有用于有机结构到名称转换的开源工具。与现有解决方案的许可协议,如ChemDraw JS和LexiChem TK,需要特殊的权限才能嵌入其他平台。

来自莫斯科罗蒙诺索夫州立大学和Syntelly初创公司的研究人员开发了一种基于Transformer的人工神经方法,以IUPAC命名系统为基础生成有机化合物的名称。新的解决方案已经在Syntelly平台上实现,并且可以在线使用。

这项研究发表在《Transf》杂志上Ormer基于变压器的化学符号之间转换的人工神经网络,发表在7月20日的《科学报告》杂志上。

“最初,我们想为我们的人工智能化学平台Syntelly创建一个IUPAC名称生成器。很快我们意识到,根据数字化的IUPAC规则创建算法需要一年多的时间,所以我们决定利用我们在神经网络解决方案方面的经验,”该研究的主要作者、Syntelly创业公司的联合创始人谢尔盖·索斯宁说。

递归神经网络(RNN)和变压器已成功地应用于自然语言翻译。研究人员建立了一个基于Transformer的神经网络,可以将分子从SMILES(简化分子线性输入规范)表示形式转换为IUPAC名称,反之亦然。他们描述了他们的解决方案,讨论了他们方法的优缺点,并表明Transformer可以提供类似于人类化学直觉的东西。

结果表明,将SMILES字符串转换为IUPAC名称的Struct2IUPAC模型在PubChem的测试集中达到了http://www.zhucesz.com/的精度。反向模型(IUPAC2Struct)达到了http://www.zhucesz.com/的精度,可与开源OPSIN软件(用于名称到结构转换的开源工具)相媲美。

数据库:深度学习技术需要大量数据。新网络使用了世界上最大的开放化学数据库PuBChem进行培训和测试,共有94,726,085座建筑。将数据库分为两部分,一部分用于培训,另一部分用于测试。

IUPAC和SMILES标记:标记化是将序列划分为块并划分这些块(标记)的过程。它是语言模型的一个常见的预处理阶段。使用基于字符的SMILES标记,实现基于规则的IUPAC标记。该研究的IUPAC标记物是手工设计和管理的。该标记正确处理多达99个来自PubChem分子。

插图:SMILES标记化(上)和IUPAC名称标记化(下)的演示(论文)

Transformer Model:使用谷歌团队设计的现代神经结构Transformer作为研究的基础,训练它将分子的结构表示转换为IUPAC名称,反之亦然。谷歌团队是最强大的机器翻译神经网络之一,最初由谷歌设计。

训练了两个模型:Struct2IUPAC,它将SMILES字符串转换为IUPAC名称;IUPAC2Srtuct,它执行反向转换。基本上,不需要IUPAC2Srtuct模型,因为开源OPSIN可以成功使用。

图:Struct2IUPAC变压器模型(论文)

验证步骤:使用OPSIN,您可以验证生成的化学名称,以确保它们与正确的结构相对应。可以检测到生成器的故障,并且不会显示错误的名称。

说明:验证步骤。(纸)

优势1:Struct2IUPAC模型精度可达http://www.zhucesz.com/

为了验证模型的质量,研究人员从测试集中随机选择了10万个分子。向IUPAC微笑名称转换器作为验证步骤运行,在测试集中100,000个随机分子的子集上实现http://www.zhucesz.com/精度。

“我们已经证明了Transformer可以准确地解决算法问题,为软件开发提供了一种新的范式,它颠覆了人们认为Transformer不应该用于此类问题的普遍看法。在机器翻译中,可以用同义词替换一个单词,而在我们的例子中,一个错误的符号将导致错误的分子。然而,Transformer成功地完成了这项任务。”Sosnin补充道。

优势2:IUPAC2Struct模型精度高达http://www.zhucesz.com/

研究人员在测试集中比较了IUPAC和SMILES变压器模型(IUPAC2Struct)和基于规则的工具OPSIN(表1)。IUPAC2Struct转换器实现了http://www.zhucesz.com/的精度,而OPSIN执行http://www.zhucesz.com/。

表1:模型在不同光束尺寸的10万个分子试验装置上的精度()。

在我们的数据集中,具有大量标记物(低聚物、多肽等)的分子的代表性不足,这可能是这类大分子性能下降的原因。

尽管这个模型在非常大的分子上的精确度低于50,但人们发现了一些复杂分子的有趣例子,它们可以正确地生成IUPAC名称。

插图:Transformer生成了两个具有正确名称的挑战分子的示例。

此外,非常小分子的性能显著下降。例如,对于甲烷,Transformer可能使用一种自我注意机制来分析输入序列中的标记之间的相关性。对于超短序列,很难把握符号之间的关系。

新的解决方案已经在Syntelly平台上实现,并且可以在线使用。研究人员希望他们的方法可以用于化学符号之间的转换,以及其他与技术符号相关的任务,如数学公式的生成或软件程序的翻译。

研究人员说:“令人惊讶的是,我们基于神经的解决方案的性能可以与基于规则的软件相媲美。”

在介绍前,小编免责:只代表个人试用经验,更专业的学生,应该有更多的收获~

该期刊论文指出,“目前还没有用于结构到名称翻译的开源工具。”

首先,在线开源

http://www.zhucesz.com/,左边的菜单栏有很多功能选项。从这里,选择“个人”选项,点击搜索框到画板。输入你想命名的有机化合物的结构,例如甲苯(C7H8)。

点击“计算”,通过SMILES: cc1ccc1得到甲苯,IUPAC名称:甲苯。

“分子可以从SMILES变成IUPAC名称,反之亦然,”该期刊论文说。

此处为SMILES/IUPAC,也可点击'Calculate'获得甲苯结构及其对应的SMILES/IUPAC。

此外,该工具还附带了一个非常大的数据集库。

也有关于有机化学结构命名的期刊文章发表。当然,你也可以上传新论文的PDF文件。

它还可以预测化学反应:

更多功能可以解锁,朋友自己拿~

在有机化学的早期阶段,化合物的命名没有通用的规则。国际纯化学与应用化学联合会(IUPAC)成立于1919年。IUPAC出版了有机化学的命名法,俗称“蓝皮书”化合物的特定名称指南。

现在有几种有机结构的替代表现形式。例如,简化分子输入行输入系统(SMILES, Simplified molecule - input Line-entry System)旨在促进基于人类和计算机的化学信息处理。