TY - JOUR ID - TI - An overview for assessing a number of systems for estimating age and gender of speakers نظرة عامة لتقييم عدد من أنظمة تقدير عمر وجنس المتحدثين AU - Yusra Faisal Al-Irhayim2 يسرى فيصل الارحيم AU - Aalaa Ahmed Mohammed1, الاء احمد محمد احمد، PY - 2021 VL - 26 IS - 1 SP - 94 EP - 100 JO - Tikrit Journal of Pure Science مجلة تكريت للعلوم الصرفة SN - 18131662 24151726 AB - The determination of the age and gender of the speaker of the speech signal is an interesting topic in the interaction between human-machine. Speech signal has a variety of applications ranging from speech analyses to allocate human-machine interactions. This paper aims to conduct a comparative study of age and gender classification algorithms applied to the speech signal. Comparison of experimental results of different sources of voices for speakers of different languages and methods of miscellaneous classification such as Bayes classifier, neural network, support vector machines, K-nearest neighbor, gaussien mixture model and hybrid method based on weighted analysis of a directed non-negative matrix and a neural network with a general recession as well as some deep learning methods, is done in order to show different results to classify the age and gender of the speaker when processing the speech signal. The study showed that methods and algorithms of deep learning have excelled in providing accuracy ratios higher than other methods, and it shows that the hybridization of two or more classification methods increases the accuracy level of the results.

إنّ تحديد عمر وجنس المتحدث من إشارة الكلام موضوعًا مثيرًا للاهتمام في التفاعل بين الإنسان والآلة. تحتوي إشارة الكلام على مجموعة متنوعة من التطبيقات تتراوح من تحليلات الكلام إلى تخصيص التفاعلات بين الإنسان والآلة. تهدف هذه الورقة إلى إجراء دراسة مقارنة لخوارزميات تصنيف العمر والجنس المطبقة على إشارة الكلام. تمت مقارنة النتائج التجريبية لمصادر مختلفة من الأصوات لمتحدثين بلغات مختلفة وطرق التصنيف المتنوعة مثل مصنف بايز والشبكة العصبية الالتفافية وآلات دعم المتجه والجار الأقرب ونموذج الخليط الغاوسي وطريقة هجينة بالاعتماد على التحليل الموزون لمصفوفة غير سالبة موجَهة وشبكة عصبية ذات انحسار عام بالإضافة إلى بعض طرق التعلم العميق، من أجل إظهار النتائج المختلفة لتصنيف العمر والجنس للمتحدث عند معالجة إشارة الكلام. أظهرت الدراسة أن طرق وخوارزميات التعلم العميق تفوقت في توفير نسب دقة أعلى من الطرق الأخرى، كما توضح أن تهجين طريقتين أو أكثر من طرق التصنيف يزيد من مستوى دقة النتائج. ER -