2023年12月13日发(作者:)

化工文件格式

这篇文章谈论一些共同的分子文件格式,包括用法和转换在他们之间。 它也列出几个来源为自由得到关于互联网的化工数据。

通常提供化工信息 文件 或 小河 并且许多格式创造了,以不同程度文献。 格式可以通过三个手段发现(参见化工MIME部分)

文件扩展名 (通常3封信件)。 这用途广泛,但易碎作为共同的词尾例如“.mol”和” .dat由许多系统使用,包括非化学制品一个。

自已描述文件 那里格式信息在文件包括。 例子是CIF和CML。

chemical/MIME类型 由一台化工明白的服务器增加。

内容

1 化工数据的来源

2 化工标记语言

3 蛋白质数据库格式

4 GROMACS格式

5 CHARMM格式

6 Ghemical文件格式

7 SYBYL线记法

8 微笑

9 其他共同性格式

10 转换在格式之间

11 化学制品MIME项目

12 化学制品MIME支持

13 参见

14 参考

15 外部链接

化工数据的来源

这自由地可利用的分子数据的来源一个最后的名单。 比这里被列出有许多资源那里在互联网。 这些来源的链接在参考如下被给。

1. 美国 健康全国学院 PubChem 数据库是化工数据的一个巨大的来源。 所有数据在二维度。 数据包括SDF、微笑、PubChem XML和PubChem

ASN1格式。 2. 蛋白质数据库是一个优秀蛋白质来源分子数据。 数据是三维和,假设以蛋白质数据库(PDB)格式。

3. eMolecules 是一个商业数据库为分子数据。 数据包括一张二维结构图和微笑串为其中每一化合物。 eMolecules支持根据分子结构的部分的快速亚结构搜寻。

4. ChemExper是一个商业数据库为分子数据。 查寻结果包括一张二维结构图和一个痣文件为许多化合物。

5. 纽约三维分子结构大学图书馆。

6. 美国环境保护代办处分布的结构搜查的毒力(DSSTox)数据库网络是EPA的计算毒素学节目项目。 数据库提供SDF分子文件以焦点在致癌物质和否则毒性物质。

化工标记语言

化工标记语言 (CML)是一个开放标准为代表分子和其他化工数据。 开放来源项目包括XML图解、原始代码为解析和与CML数据一起使用和一个活跃社区。 为与化工标记语言一起使用和XML的文章工具为化学和生物科学较详细地谈论CML。 CML数据文件由许多工具接受,包括JChemPaint, Jmol, XDrawChem

并且MarvinView。

蛋白质数据库格式

蛋白质数据库格式 为蛋白质是常用的,但它可以为分子的其他类型使用。 它最初被设计了作为固定专栏宽度格式和正式地因而有原子的一个固定最大数字;

然而,许多工具可能读超出极限的文件。 某一PDB文件包含描述原子连通性的一个任意部分并且位置。 由于这些文件有时用于描述代表的大分子汇编或分子

明确溶剂他们可以增长非常大并且经常是压缩的。 有些工具,例如 Jmol能读PDB文件gzipped格式。 PDB 维护PDB文件格式和它的XML选择, PDBML的规格。 典型的文件扩展名为PDB文件是 .pdb,虽然一些更旧的文件用途 .ent

或 .brk. 一些分子塑造的工具写适应基本格式他们自己的需要的非标准PDB样式文件。

GROMACS格式

GROMACS文件格式家庭被创造了为使用与分子模仿软件包裹 GROMACS. 它严密类似PDB格式,但为存放产品设计从 分子动力学 模仿,因此它考虑到另外的数字精确度和任意地保留关于微粒的信息 速度 并且位置在特定点在模仿弹道。 它没考虑到连通性信息存贮,在GROMACS得到从分开的分子和系统拓扑结构文件。 典型的文件扩展名为GROMACS文件是 .gro. CHARMM格式

CHARMM 分子动力学包裹可能读和写一定数量的标准化学制品和生物化学的文件格式; 然而,卡片(座标)和PSF (蛋白质结构 文件)对CHARMM是主要独特的。 卡片形式是固定专栏宽度,类似PDB格式和为存放原子座标完全使用。 PSF文件包含描述原子债券)的原子连通性信息(和在开始模仿之前需要。 半新的典型的文件扩展名是 .crd 并且 .psf 分别。

Ghemical文件格式

Ghemical 软件可能使用OpenBabel进口和出口一定数量的文件格式。 然而,默认情况下,它使用GPR格式。 这个文件由几个零件编辑,分离由标记(! 倒栽跳水,! 信息,! 原子,! 债券,! Coord,! PartialCharges和! 末端)。

提出的MIME类型为这个格式是 application/x-ghemical.

SYBYL线记法

SYBYL线记法 (SLN)是化学制品 线记法. 凭微笑,它合并完全句法为指定相对立体化学。 SLN有考虑到Markush询问的规格的富有的询问句法。 句法也支持组合图书馆的规格。

例子SLNs

描述

胺基代丙酸

显示R侧链的询问

SLN串

C [1] H :CH :CH :CH :CH :CH :@1

NH2C [s=n] H (CH3) C (=O) OH

R1 [hac> 1] C [1] :C :C :C :C :C :@1

询问为氨化物或sulfamide NHC=M1 {M1 :O, S}

微笑

Simplified Molecular Input Line Entry Specification (微笑)是a 线记法 为分子。 微笑串包括连通性,但不包括第2或3D座标。

氢原子没有代表。 其他原子由他们的元素标志B、C、N、O、F、P、S、分类、增殖比和I.代表。 标志“=”代表双键,并且“#”代表三键。 分支被表明()。 圆环由对数字表示。

有些例子是

名字

甲烷

惯例

CH4 C

微笑串

对氨基苯甲酸二

C2H6O CCO 苯

乙烯

C6H6

C1=CC=CC=C1或c1ccccc1

C2H4 C=C

其他共同性格式

其中一个最宽的半新业界标准是 化工表文件 格式,象

结构数据格式 (SDF)文件。 他们是遵守一个严密的格式为代表多个化学结构纪录和伴生的数据域的文本文件。 格式由被限制的分子设计最初开发并且出版(MDL)。 MOL是另一个文件格式从MDL。 它在白皮书的第4章被提供 媒介:MDL CTfile格式.

PubChem也有XML和ASN1文件格式,是出口选择从PubChem网上数据库。

他们是都基于的文本(ASN1经常是一个二进制格式)。

有在桌里如下所示的很大数量的其他格式。

转换在格式之间

OpenBabel 并且 JOELib 自由地是具体地被设计的可利用的开放来源工具为转换在文件格式之间。 他们的化工专家系统支持大原子类型变换桌。

巴比伦- i

input_format

input_file - o

output_format

output_file

例如,转换在SDF的文件成CML使用命令

巴比伦- i sdf - o cml l

发生的文件是 l。

一定数量的工具为观察意欲,并且编辑分子结构能读文件以一定数量的格式和写他们在其他格式。 工具JChemPaint (根据 化学发展成套工具), XDrawChem

(基于 OpenBabel), 编钟和 Jmol 适合到这个类别里。

化学制品MIME项目

“化学制品MIME”是一种事实上方法为增加 MIME 类型对化工小河。

在化学车间期间在第一次万维网国际会议,这个项目在1994年5月开始了于1994年1月和首先宣布了,举行在CERN。 互联网草稿的第一个版本被出版了在5月10月1994年和第二个修证本期间在4月9月期间1995年。 纸在1996年8月提出了对CPEP

(委员会在打印的和电子出版物)在IUPAC会议上为讨论是可利用的。

文件扩展名 MIME 类型 固有名称 描述

alc

chemical/x方术 方术格式

csf

chemical/x贮藏所csf 贮藏所MolStruct CSF

cbin, cascii, ctab chemical/x cactvs二进制 CACTVS格式

cdx chemical/x-cdx

ChemDraw交换文件

cer chemical/x-cerius

MSI Cerius II格式

c3d chemical/x-chem3d

Chem3D格式

chm chemical/x-chemdraw

ChemDraw文件

cif chemical/xcif

晶体信息文件晶体信息框架

由公布 结晶学国际联合

cmdf chemical/x-cmdf

CrystalMaker数据格式

cml chemical/x-cml

化工标记语言

XML 基于 化工标记语言.

cpa

chemical/x指南针 Takahashi的指南针节目

bsd

chemical/x交火 交火文件

csm, csml

chemical/x-csml

化工样式标记语言

ctx chemical/x-ctx

Gasteiger小组CTX文件格式

cxf, cef

chemical/x-cxf

化工交换格式

emb, embl chemical/x embl dl核苷酸 EMBL核苷酸格式

spc

chemical/x太空星群spc SPC格式为鬼和色谱分析的数据

inp, gam,流浪儿 chemical/x gamess输入 GAMESS输入格式

fch, fchk chemical/x高斯检查站 高斯检查站格式

高斯立方体(Wavefunction)

崽 chemical/x高斯立方体

Forma

gau, gjc, gjf chemical/x高斯输入 高斯输入格式

gcg

chemical/x gcg8序列 蛋白质序列格式

gen chemical/x-genbank

ToGenBank格式

istr, ist

chemical/x-isostar

分子间的互作用IsoStar图书馆

jdx, dx

chemical/x-jcamp-dx

JCAMP 分光镜数据交换的格式

家族

chemical/x-kinemage

运动(蛋白质结构)图象

mcm chemical/x-macmolecule

MacMolecule文件格式

mmd, mmod chemical/x宏观模式输入 宏观模式分子技工

mol chemical/x-mdl-molfile MDL Molfile

微笑, smi chemical/x白天微笑 被简化的分子输入线词条规格 一条线记法为分子。

sdf chemical/x-mdl-sdfile

结构数据文件

明确的规格在 /chemime/ 哪些更新,当主要新型出现。

化学制品MIME支持

为在您的系统登记化工MIME类型的Unix或Linux有可利用。 节目可能然后登记作为观察者、编辑或者加工者为这些格式,以便完全支持为化工MIME类型是可利用的。

化学制品笑剧数据: /chemical-mime/

参见

文件格式

OpenBabel, JOELib, OELib

化学发展成套工具

化工标记语言

参考

白天微笑主页

白天微笑理论和细节

医学, PubChem网上数据库国立图书馆

研究Collaboratory为结构Bioinformatics,蛋白质数据库

eMolecules (由eMolecules,公司)

纽约三维分子结构大学图书馆

MDL CTfile格式化白皮书

外部链接

网上分子格式交换器 基于开放巴比伦

E巴比伦 附属程序为根据开放巴比伦的网上分子格式交换器