research centers


Search results: Found 4

Listing 1 - 4 of 4
Sort by

Article
Speaker Sound Coding Using Vector Quantization Technique (Vq)
ترميز صوت المتكلم باستخدام تقنية تكميم المتجهات

Author: Oday Kamil Hamid
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2014 Volume: 32 Issue: 6 Part (A) Engineering Pages: 1399-1410
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

The key objective of this research is to compress the speech sound or in another meaning coding speaker sound with a small matrix called code book represent the speaker sound information this is done by using Vector Quantization method (VQ).The sound features here represented with both types Linear Predictive Coding (LPC) and autocorrelation coefficients that represent the data base of this research.The algorithm is tested upon a database consist of matrix with dimensions (54*13) which represent speaker sound information with normalized autocorrelation coefficients and compress it to a codebook (CB) contain 8 codeword (8 CW) with autocorrelation coefficients and the other CB with LPC coefficients of order p=12. From this project we can notes how much the sound information can be compressed which represented at first with a matrix of dimensions (54*13) and transfer it to a matrix with dimensions (8*12) or (8*13) with same feature sound of speaker.In this project there is no focus on LPC method and how it work but used it in extracting Sound features in another program which represent data base for this project and inter it to VQ algorithm The algorithm was examined through computer simulation using Matlab version 6 programming language and under Microsoft Windows XP operating system.

ان الهدف الرئيسي لهذا البحث هو ضغط المعلومات الصوتية للكلام اوبمعنى اخر تشفير صوت المتكلم بمصفوفة صغيرة تدعى كتاب التشفير يمثل معلومات صوت المتكلم وهذا تم تنفيذه باستخدام طريقة تكميم المتجهات VQ. ان الميزات الصوتية هنا تم تمثيلهابكلا النوعين، معامل تشفير التنبؤ الخطي ومعامل الارتباط. ان الخوارزمية تم اختبارها على قاعدة بيانات تتكون من مصفوفة ابعادها (13*54) والتي تمثل المعلومات الصوتية للمتكلم بمعامل الارتباط الطبيعية وضغطها لكتاب تشفير CB يتكون من 8 كلمات تشفير CW مع معامل الارتباط الطبيعي والكتاب الاخر مع معامل تشفير التنبؤ الخطي مع رتبة تشفير P=12.ومن خلال هذا البحث نلاحظ كم تم ضغط المعلومات الصوتية حيث كانت تتمثل بمصفوفة حجمها (13*54) وتحويلها الى مصفوفه حجمها (12*8) او (13*8) مع بقاء الميزه الصوتيه للمتكلم. في هذا البحث لم يتم التركيز على طريقة تشفير التنبؤ الخطي وكيفية عملها ولكن تم استخدمتها في برنامج اخر لاستخراج الميزات الصوتية لم يتم التطرق اليه واعتبارها كقاعدة بيانات لهذا البحث وادخالها لخوارزمية تكميم المتجهات VQ . ان الطريقه المقترحة قد تم اختبارها من خلال برامج محاكاة بالحاسبة باستخدام برنامج Matlab 6 كلغة برمجة تحت نظام تشغيل وهو .XP


Article
Speech Signal Compression Using Wavelet AndLinear Predictive Coding
ضغط الملفات الصوتية باستعمال تحويل المويجة والتشفير ذو الأستنتاجات الخطية

Authors: Ahlam Hanoon احلام حنون --- Dr. Tarik Zeyad طارق زياد
Journal: Al-Khwarizmi Engineering Journal مجلة الخوارزمي الهندسية ISSN: 18181171 23120789 Year: 2005 Volume: 1 Issue: 1 Pages: 52-60
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

A new algorithm is proposed to compress speech signals using wavelet transform and linear predictive coding. Signal compression based on the concept of selecting a small number of approximation coefficients after they are compressed by the wavelet decomposition (Haar and db4) at a suitable chosen level and ignored details coefficients, and then approximation coefficients are windowed by a rectangular window and fed to the linear predictor. Levinson Durbin algorithm is used to compute LP coefficients, reflection coefficients and predictor error. The compress files contain LP coefficients and previous sample. These files are very small in size compared to the size of the original signals. Compression ratio is calculated from the size of the compressed signal relative to the size of the uncompressed signal. The proposed algorithms where fulfilled with the use of Matlab package.

تم في هذا البحث استخدام التحويل نوع التحويل المويجة واستخدام المرشح ذو معاملات الاستنتاج الخطية لغرض ضغط حجم الملفات التي تحتوي على تسجيلات صوتية. تم أستخدام التحويل المسمى تحويل المويجة نوع Haar و db4 لغرض تنفيذ عملية الضغط الأولى واحتساب نسبة ضغط الملفات بأستخدام كافة الطرق أما بصورة مفردة أو بصوزة مجتمعة. تم احتساب معاملات المرشح باستخدام خوارزمية Levinson Durbin وكانت نسبة ضغط الملفات تعتمد على نسبة خطأ المرشحات تم مقارنة حجم الملفات المضغوطة مع الملفات الأصلية وكذلك أحتساب نسبة الخطأ التي تنتج من عملية الضغط وكانت جميع الملفات التي تم ضغطها هي ملفات قيم.


Article
Exploring New Features for a Wavelet Neural Digital Modulation Recognition System-eng
استكشاف خصائص جديدة لنظام تمييز التضمين الرقمي مبني باستخدام التحويل المويجي والشبكات العصبية

Author: Dr. Ahmed Maamoon Alkababji د.احمد مأمون فاضل
Journal: AL Rafdain Engineering Journal مجلة هندسة الرافدين ISSN: 18130526 Year: 2013 Volume: 21 Issue: 4 Pages: 96-108
Publisher: Mosul University جامعة الموصل

Loading...
Loading...
Abstract

AbstractModulation recognition has been an important problem in both commercial and military wireless communication. Modulation recognition can be divided into two categories: identification between categories and identification in category. In this work a system is proposed for identification between categories of different digital modulated signals using a combination of discrete wavelet transform (DWT) and the linear predictive coding (LPC) with the probabilistic neural network (PNN) as a classification tool. It was found that the proposed system out performed any of the existing systems by using six DWT decomposition levels and 20 LPC coefficients. The symlet 20 wavelet filter proved to be the best candidate. The results showed that a 100% recognition can be achieved at a signal to noise ratio (SNR) of 2db for the digitally modulated signal.Keywords: Modulation recognition, Wavelet, linear predictive coding, Probabilistic neural network.

الملخصيعتبر تمييز نوع التضمين مشكلة هامة في مجال الاتصالات اللاسلكية على حد سواء التجارية والعسكرية. ويمكن تقسيم تمييز التضمين إلى فئتين: تحديد نوع التضمين وتحديد درجة التضمين في فئة. في هذا العمل تم اقترح نظام لتحديد نوع التضمين بين فئات مختلفة من إشارات التضمين الرقمية باستخدام مزيج من تحويل المويجات المنفصل (DWT)و الترميز الخطي التنبؤي (LPC) مع أداة تصنيف هي الشبكة العصبية الاحتمالية(PNN) . حيث تبين ان النظام المقترح فاق أي من النظم القائمة عن طريق استخدام ستة مستويات تحليل DWT و 20 معاملLPC. ثبت ان مرشح المويجات 20 symlet هو أفضل مرشح يمكن استخدامه للنظام المقترح. أظهرت النتائج التي التوصل الى تمييز 100٪ للإشارة المضمنة رقميا بوجود نسبة الضوضاء (SNR) 2db.


Article
Speech Hiding Using Linear Predictive Coding and Discrete Wavelet Transform

Authors: Dr. Saad Najim Al-Saad د. سعد نجم السعد --- Jamal Nasir Hasoon جمال ناصر حسون
Journal: Iraqi Journal of Information Technology المجلة العراقية لتكنولوجيا المعلومات ISSN: 19948638/26640600 Year: 2014 Volume: 6 Issue: 1 اللغة الانكليزية Pages: 1-13
Publisher: iraqi association of information الجمعية العراقية لتكنولوجيا المعلومات

Loading...
Loading...
Abstract

In this work we introduced an efficient method to hiding speech signal that encoding with LPC (linear predictive coding), these parameters converted to LSF (line spectral frequency),these were less sensitive to change and more robustness. These parameters embedded in cover speech after converting in wavelet domain that split high frequency from low frequency. The high frequency converted to frequency domain by Fast Fourier Transform by replacing the magnitudes with these parameters. The phases kept and inverse Fast Fourier Transform to obtainwavelet domain and obtained the stego speech that perceptually indistinguishable from the equivalent cover speech.The proposed method allows hiding a large amount of secret information while rendering the steganalysis more complex.

فكرة البحث تقديم طريقة كفوءة لأخفاء اشارة الصوت في اشارة صوت اخرى عن طريق ترميز اشارة الصوت المراد اخفاؤها بترميز التوقع الخطي (LPC) ومن ثم تحويل المعاملات المستخلصة بهذا الترميز الى تمثيل اخر هو خط تردد الطيف (LSF) الذي تكون معاملاته موجبة و نسبة التحسس للتغيرات البسيطة قليلة هذه المعاملات تخفى داخل اشارة صوت اخرى تكون اكبر او تساوي الاولى وتسمى الغطاء يتم تحويلها الى مجال اخر يسمى مجال المويجه من خلال هذا المجال تفصل الترددات العالية عن الترددات الواطئة وتحويل الترددات العالية الى مجال اخر هو المجال الترددي عن طريق تحويل فوريير السريع ومنه نحصل التمثيل القطبي للاشارة (الطور و القيمة المكانية) ومن تبديل القيمة المكانية وتثبيت الطور وتطبيق معكوس التحويلات المستخدمة نفسها نحصل على اشارة صوت قريبة من الاشارة الاصلية ولاتميزها الأذن البشرية عند سماعها تسمى الاشارة المضمنة (stego signal) وعملية ايجاد الاشارة المخفية في الجهة الاخرى تطبيق نفس التحويلات والوصول الى الاماكن التي تم الاخفاء فيها والحصول على المعاملات التي من خلالها يتم استرجاع اشارة الصوت . هذه الطريقة تعطي حجم اخفاء جيد و تعقيدات كبيرة للحصول على الاشارة المخفية.

Listing 1 - 4 of 4
Sort by
Narrow your search

Resource type

article (4)


Language

English (3)

Arabic and English (1)


Year
From To Submit

2014 (2)

2013 (1)

2005 (1)