A quantitative structure-property relationship (QSPR) analysis of the Setschenow constants (K salt ) of organic compounds in a sodium chloride solution was carried out using only two-dimensional (2D) descriptors as input parameters. The whole set of 101 compounds was split into a training set of 71 compounds and a validation set of 30 compounds by means of the Kennard and Stones algorithm. A general four-parameter equation, with correlation coefficient (R) of 0.887 and standard error of estimation (s) of 0.031, was obtained by stepwise multilinear regression analysis (MLRA) on the training set. The reliability and robustness of the present model was verified with leave-one-out cross-validation, randomization tests, and the external validation set. All of the descriptors contained in this model are calculated directly from the molecular 2D structures; thus, this model can be used to easily predict the K salt of other compounds not involved in the present dataset.Keywords: QSPR; Setschenow constants; 2D descriptor; multilinear regression analysis
ЕДНОСТАВЕН 2D-QSPR-МОДЕЛ ЗА ПРЕДВИДУВАЊЕ НА КОНСТАНТИТЕ НА SETSCHENOW ЗА ОРГАНСКИТЕ СОЕДИНЕНИЈААнализата на квантитативната зависност на структурата и својствата (QSPR) на константите на Setschenow (K salt ) на органските соединенија во раствор од натриум хлорид е извршена користејќи само дводимензионални (2D) дескриптори како влезни параметри. Целото множество од 101 соединение беше поделено во множество за подготовка од 71 соединение и множество за валидација од 30 соединенија според алгоритамот на Kennard и Stones. Од множеството за подготовка со мултилинеарна регресиона анализа MLRA е добиена општа четирипараметарска равенка со коефициент на корелација R = 0,887 и стандардна грешка на процената s = 0,031. Веродостојноста и робусноста на овој модел беше верифицирана со повеќе тестови: вкрстена валидација со испуштање на еден параметар, тест на рандомизација, како и екстерно множество за валидација. Сите дескриптори содржат модел што се пресметува директно од молекулските 2D-структури, и така овој модел може да се користи за едноставно предвидување на K salt на други соединенија што не се вклучени во ова множество на податоци.