@Article{, title={Improved Accuracy Pair-wise Sequence Alignment Used in Distance Computation Using MATLAB تحسين دقة اصطفاف زوج من المتتابعات البيولوجية المستخدمة في حساب المسافة باستخدام برنامج الماتلاب}, author={Mohammed W. Al-Neama محمد واجد النعمة}, journal={Journal of Education and Scientific Studies مجلة الدراسات التربوية والعلمية}, volume={5}, number={10}, pages={134-154}, year={2017}, abstract={Distance Matrix (DM) is the first and most important stage of finding Multiple Sequence Alignment (MSA). The computations method varies according to the algorithm used to: Direct algorithm speeds execution with low storage capacity at the expense of the accuracy of the results, which this algorithm is used in the MATLAB program . And indirect algorithm need more time and greater storage capacity with high accuracy results. The number of matches is computed for each pair of sequences, which increases the program execution time and storage capacity incrementally with the number of sequences in the database. In this study, the most common way to calculate the distance matrix was reviewed. As well as creating a new function to add to the Bioinformatics Toolbox to optimize the calculations used to create distance matrix to get multiple sequence sequences more accurately than the function currently available in MATLAB2014. As well as, to increase the speed of this method Parallel Toolbox was used to increase the efficiency of the program used in addition to improve the accuracy of the results.The results of the search for the ability of the proposed algorithm from the computation of the multiple sequences of multiple MSA high-length high accuracy compared to the current methods used in the MATLAB program. A new function was carried out on real biological sequences with lengths up to 65kbp nucleotide, and using a platform equipped with Intel processor core-i7-3770 quad-core and has a 3.40GHz speed and 8GB internal memory.

تعد مصفوفة المسافة Distance Matrix (DM) اولى مراحل إيجاد اصطفاف المتتابعات المتعددة Multiple Sequence Alignment (MSA) وأكثرها أهمية. وتختلف طريقة احتسابها حسب الخوارزمية المستخدمة الى: مباشرة سريعة التنفيذ قليلة سعة التخزين على حساب دقة النتائج، وهذه الطريقة مستخدمة في برنامج MATLAB. وغير المباشرة تحتاج وقتاً أكثر وسعة تخزينية أكبر بنتائج تمتاز بدقة عالية. إذ يتم إيجاد عدد التطابقات لكل زوجين من المتتابعات، مما يؤدي إلى زيادة وقت تنفيذ البرنامج وسعة التخزين بشكل اطرادي مع عدد المتتابعات في قاعدة البيانات. في هذا البحث تم استعراض أكثر الطرق شيوعاً لحساب مصفوفة المسافة DM. فضلاً عن انشاء دالة تضاف إلى ادوات Bioinformatics Toolboxbox لتحسين الحسابات المستخدمة في إيجاد DM لإنتاج اصطفاف متتابعات متعددة بصورة ادق من الدالة المتوفرة حالياً في برنامج MATLAB2014. ولزيادة سرعة هذه الطريقة تم الاستعانة بأدوات التوازي Parallel Toolboxbox وذلك لزيادة كفاءة البرنامج المستخدم بالإضافة لتحسين دقة النتائج.وقد اظهرت نتائج البحث عن امكانية الخوارزمية المقترحة من احتساب اصطفاف المتتابعات المتعددة MSA ذات الأطوال الكبيرة بدقة عالية مقارنة مع الطرق المستخدمة الحالية في برنامج MATLAB. إذ تم تنفيذها على متتابعات بيولوجية حقيقية ذات اطوال وصلت إلى اكثر من 65kbp نيوكلويتايد، وباستخدام جهاز حاسوب مجهز بمعالج انتل Core-i7-3770 رباعي النواة وذو سرعة 3.40GHz وبذاكرة داخلية 8GB.} }