SMILES (англ. Simplified Molecular Input Line Entry Specification) — специфікація спрощеного представлення молекул в рядку введення — система правил (специфікація) однозначного опису складу та структури молекули хімічної речовини з використанням рядка символів ASCII у рядковому типі.
Рядок символів, складений за правилами SMILES, може бути перетворений багатьма молекулярними редакторами у двовимірну або тривимірну структурну формулу молекули.
Початковий варіант специфікації SMILES був розроблений Артуром (Arthur Weininger) і Девідом (David Weininger) Вайнінґерами наприкінці 1980-х. Надалі стандарт був модифікований і розширений; найактивнішу участь у цій роботі взяла компанія Daylight Chemical Information Systems, Inc.
У 2007 році прийнято відкритий стандарт OpenSMILES розроблений Blue Obelisk.
Приклади
SMILES запис | Структурна формула | Назва |
---|---|---|
C | CH4 | Метан |
CC | CH3-CH3 | Етан |
CCC | CH3-CH2-CH3 | Пропан |
Clc(c(Cl)c(Cl)c1C(=O)O)c(Cl)c1Cl | C7HCl5O2 |
Принципи побудови SMILES
Атоми
Атоми позначаються символами хімічних елементів у квадратних дужках, наприклад, золото позначається як [Au]. Для елементів- складових органічних молекул (B, C, N, O, P, S, F, Cl, Br, I) дужки можуть бути опущені. У цьому випадку атоми водню можна не вказувати в явному вигляді, якщо їх кількість відповідає найменшій нормальній валентності відповідно до явно заданих зв'язків. Атоми в складі ароматичних циклів зазвичай записуються малими літерами замість великих. При необхідності вказати формальний заряд частинки атоми водню і символ заряду записуються в явному вигляді. Ізотопи записуються в квадратних дужках із зазначенням атомної ваги перед символом атома, наприклад, ізотоп 13C буде записаний як [13C].
Наприклад, запис SMILES для води буде виглядати як O, для етанолу — CCO. Аніон гідроксилу записується [OH-], а іон заліза (II) як [Fe+2].
Зв'язки
Зв'язок | Символ | опція |
---|---|---|
Простий зв'язок | - | так |
Подвійний зв'язок | = | ні |
Потрійний зв'язок | # | ні |
Чотирьохкратний зв'язок* | $ | ні |
Ароматичні зв'язки | : | так |
* Лише OpenSMILES
Розгалуження
Бічні ланцюги молекули поміщають в круглі дужки. Наприклад, пропіонова кислота записується як CCC(= O)O. Канонічна форма запису трифторметану виглядає як C(F)(F)F, однак такий запис незручний для читання внаслідок своєї перевантаженості дужками, тому ту ж молекулу можна записати в неканонічній формі як FC(F)F.
Структурна формула | SMILES-String | Назва |
---|---|---|
CC(=O)O | Оцтова кислота | |
CC(C)(C)O | трет-Бутанол | |
C(C(CO[N+](=O)[O-])O[N+](=O)[O-])O[N+](=O)[O-] |
Циклічні структури
Атоми, що знаходяться на кінцях розірваного при побудові кістяка набору зв'язків, позначаються одним і тим же номером. Наприклад, циклогексан записується як C1CCCCC1, а бензол — як c1ccccc1.
Структурна формула | SMILES-String | Назва |
---|---|---|
c1ccccc1 | Бензол | |
Cc1c([N+]([O-])=O)cc([N+]([O-])=O)cc1[N+]([O-])=O | Тринітротолуол | |
C1=CC=C2C=CC=CC2=C1 | Нафталін |
Примітки
- David Weininger, SMILES, a chemical language and information system. J. Chem. Inf. Comput. Sci.1988, 28, ст 31.
- . Архів оригіналу за 13 липня 2010. Процитовано 25 липня 2010.
- . Архів оригіналу за 13 липня 2010. Процитовано 25 липня 2010.
Це незавершена стаття з хімії. Ви можете проєкту, виправивши або дописавши її. |
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
SMILES angl Simplified Molecular Input Line Entry Specification specifikaciya sproshenogo predstavlennya molekul v ryadku vvedennya sistema pravil specifikaciya odnoznachnogo opisu skladu ta strukturi molekuli himichnoyi rechovini z vikoristannyam ryadka simvoliv ASCII u ryadkovomu tipi Generaciya nomera SMILES Spochatku koduyutsya rozirvani kilcya potim opisuyetsya vidgaluzhennya vid osnovnoyi strukturi Ryadok simvoliv skladenij za pravilami SMILES mozhe buti peretvorenij bagatma molekulyarnimi redaktorami u dvovimirnu abo trivimirnu strukturnu formulu molekuli Pochatkovij variant specifikaciyi SMILES buv rozroblenij Arturom Arthur Weininger i Devidom David Weininger Vajningerami naprikinci 1980 h Nadali standart buv modifikovanij i rozshirenij najaktivnishu uchast u cij roboti vzyala kompaniya Daylight Chemical Information Systems Inc U 2007 roci prijnyato vidkritij standart OpenSMILES rozroblenij Blue Obelisk PrikladiSMILES zapis Strukturna formula Nazva C CH4 Metan CC CH3 CH3 Etan CCC CH3 CH2 CH3 Propan Clc c Cl c Cl c1C O O c Cl c1Cl C7HCl5O2 Principi pobudovi SMILESAtomiAtomi poznachayutsya simvolami himichnih elementiv u kvadratnih duzhkah napriklad zoloto poznachayetsya yak Au Dlya elementiv skladovih organichnih molekul B C N O P S F Cl Br I duzhki mozhut buti opusheni U comu vipadku atomi vodnyu mozhna ne vkazuvati v yavnomu viglyadi yaksho yih kilkist vidpovidaye najmenshij normalnij valentnosti vidpovidno do yavno zadanih zv yazkiv Atomi v skladi aromatichnih cikliv zazvichaj zapisuyutsya malimi literami zamist velikih Pri neobhidnosti vkazati formalnij zaryad chastinki atomi vodnyu i simvol zaryadu zapisuyutsya v yavnomu viglyadi Izotopi zapisuyutsya v kvadratnih duzhkah iz zaznachennyam atomnoyi vagi pered simvolom atoma napriklad izotop 13C bude zapisanij yak 13C Napriklad zapis SMILES dlya vodi bude viglyadati yak O dlya etanolu CCO Anion gidroksilu zapisuyetsya OH a ion zaliza II yak Fe 2 Zv yazkiZv yazok Simvol opciya Prostij zv yazok tak Podvijnij zv yazok ni Potrijnij zv yazok ni Chotirohkratnij zv yazok ni Aromatichni zv yazki tak Lishe OpenSMILESRozgaluzhennyaBichni lancyugi molekuli pomishayut v krugli duzhki Napriklad propionova kislota zapisuyetsya yak CCC O O Kanonichna forma zapisu triftormetanu viglyadaye yak C F F F odnak takij zapis nezruchnij dlya chitannya vnaslidok svoyeyi perevantazhenosti duzhkami tomu tu zh molekulu mozhna zapisati v nekanonichnij formi yak FC F F Strukturna formula SMILES String Nazva CC O O Octova kislota CC C C O tret Butanol C C CO N O O O N O O O N O O Ciklichni strukturiAtomi sho znahodyatsya na kincyah rozirvanogo pri pobudovi kistyaka naboru zv yazkiv poznachayutsya odnim i tim zhe nomerom Napriklad ciklogeksan zapisuyetsya yak C1CCCCC1 a benzol yak c1ccccc1 Strukturna formula SMILES String Nazva c1ccccc1 Benzol Cc1c N O O cc N O O cc1 N O O Trinitrotoluol C1 CC C2C CC CC2 C1 NaftalinPrimitkiDavid Weininger SMILES a chemical language and information system J Chem Inf Comput Sci 1988 28 st 31 Arhiv originalu za 13 lipnya 2010 Procitovano 25 lipnya 2010 Arhiv originalu za 13 lipnya 2010 Procitovano 25 lipnya 2010 Ce nezavershena stattya z himiyi Vi mozhete dopomogti proyektu vipravivshi abo dopisavshi yiyi