عنوان مقاله :
پيش بيني LD50 در مشتقات كربوكسيليك اسيد با مدل هاي رگرسيون خطي چندگانه و شبكه عصبي مصنوعي
عنوان به زبان ديگر :
Prediction of LD50 for carboxylic acid derivatives using multiple linear regression and artificial neural networks models
پديد آورندگان :
محمايي، فهيمه دانشگاه آزاداسلامي اراك - گروه شيمي , محمدي نسب، عصمت دانشگاه آزاداسلامي اراك - گروه شيمي
كليدواژه :
سميت روش رگرسيون خطي چندگانه , شبكه عصبي مصنوعي , مشتقات كربوكسيليك اسيد
چكيده فارسي :
در اين تحقيق، از طريق مطالعه رابطه ساختار-فعاليت به پيش بيني مقادير سميت مشتقات كربوكسيليك اسيد پرداخته شده است. ابتدا مقادير LD50 براي مجموعه اي از تركيبات مورد مطالعه با استفاده از منابع علمي معتبر استخراج گرديد و ساختار آنها به كمك نرم افزار گوس ويو 05 رسم شده و با نرم افزار گوسين09 به روش هارتري فاك و سري پايه G21-3 بهينه شدند. سپس با استفاده از نرم افزار دراگون توصيف گرهاي مولكولي استخراج گرديدند. به كمك ژنتيك الگوريتم و روش برگشتي توصيف گرهاي نامناسب حذف شده و بهترين آنها براي مدل هاي رگرسيون خطي چندگانه و شبكه عصبي مصنوعي مورد استفاده قرار گرفت. دقت پيش بيني مدل نهايي توسط ضرايب آماري مورد بحث قرار گرفت. اعتبارسنجي تقاطعي و نيز اعتبارسنجي خارجي مدل هاي پيش بيني همبستگي بسيار بالا را بين مقادير تجربي و مقادير پيش بيني گروه هاي آموزش آزمون و اعتبارسنجي در روش شبكه عصبي مصنوعي نشان داد. مشخص گرديد كه روش شبكه عصبي مصنوعي با خطاي كمتر و ضريب تعيين بالاتر نسبت به روش رگرسيون خطي چندگانه از برتري قابل توجه اي برخوردار مي باشد. مدل پيشنهادي مي تواند براي پيش بيني log(LD50) تركيبات جديد كربوكسيليك اسيد مفيد واقع گردد.
چكيده لاتين :
In this research, Quantitative Structure–Activity Relationship (QSAR) study has been used for
prediction of toxicity values of carboxylic acid derivatives. Firstly, the toxicity (LD50) values of
data set of studied compounds were taken from the scientific web book and the their structures
were drawn with the Gauss view 05 program and optimized at Hartree–Fock level of theory and 3-
21G basis set by Gaussian 09 software. Then the dragon software was used for the calculation of
molecular descriptors. The unsuitable descriptors were deleted with the aid of the genetic algorithm
(GA) and backward techniques, and the best descriptors were used for multiple linear regression
(MLR) and artificial neural network (ANN) models. The prediction accuracy of the final model
was discussed using the statistical parameters. Leave-one-out cross-validation and external test set
of the predictive models demonstrated a high-quality correlation between the observed and
predicted toxicity values of all, training, test and validation sets in GA-ANN method. The model by
ANN algorithm due to the lower error and higher regression coefficients was clearly superior to
those models by MLR algorithm. The proposed model may be useful for predicting log LD50 of
new compounds of similar class.
عنوان نشريه :
تحقيقات حشره شناسي