research centers


Search results: Found 7

Listing 1 - 7 of 7
Sort by

Article
Analytic study for the parallel processing algorithms
دراسة تحليلية في خوارزميات المعالجة المتوازية

Authors: Wissam Ali Hussein Salman al-Kuzaey --- Osamah Mohammed Fadhil Alyasiri
Journal: journal of kerbala university مجلة جامعة كربلاء ISSN: 18130410 Year: 2017 Volume: 15 Issue: 3 Pages: 134-145
Publisher: Kerbala University جامعة كربلاء

Loading...
Loading...
Abstract

Parallel processing technology is considered a new and important branch of the (IT) because of what it had of an extra-large prospects that expansion and rapid the processing in the computer, to make sure the work of this technique is correct and effective thus. The researcher found several ways to manage these processes which are called Algorithms (Parallel Processing Algorithms) because this technology is important, in this paper we try to cover topics such as: what is the parallel processing, what are the types of its computers, in addition to the definition of parallel processing algorithms and how to analyze them. Also, in this paper, some studies about this technique have been mentioned.Furthermore, the designing and building processing parallel algorithms has been taken as an example. Moreover, building an algorithm called (publication Algorithms) which enables the user to access of more than one processor to a specific location in memory at a same time.The conclusion obtains some results from this paper as well as some of the recommendations

تعتبر تكنولوجيا المعالجة المتوازية فرع جديد ومهم لفرع تكنولوجيا المعلومات لما تحتويه على احتمالات كبيرة جدا لتوسيع وتسريع المعالجة في الحاسوب، ولضمان عمل هذه التقنية بشكل صحيح وفعال وجدت عدة طرق لإدارة هذه العمليات سميت خوارزميات المعالجة المتوازية كونها مهمة في هذا الوقت. في هذا البحث، حاولنا تغطية المواضيع مثل ما هي المعالجة المتوازية وما هي أنواع الحواسيب التي نستخدمها في المعالجة المتوازية بالإضافة إلى تعريف خوارزميات المعالجة المتوازية وكيفية تحليلها. أيضا في هذا البحث، أشرنا الى دراسات حول هذه التقنية، بالإضافة إلى ذلك، درسنا كيفية تصميم وبناء خوارزميات المعالجة المتوازية كمثال على ذلك، قمنا ببناء خوارزمية وصف نشر خوارزمية والتي تمكن من وصول أكثر من معالج واحد إلى موقع معين في الذاكرة في نفس الوقت. وكان الاستنتاج بعض النتائج المتحصل عليها من هذا البحث وكذلك بعض التوصيات والتوفيق من الله.


Article
Effects of Parallel Processing Implementation on Balanced Load-Division Depending on Distributed Memory Systems
تأثی ا رت تنفیذ المعالجة المتوازیة على التقسیم المتوازن للحمل أعتماداً على أنظمة الذاكرة الموزعة

Authors: Subhi R. M. Zebari صبحي رفیق محمد زیباري --- Numan O. Yaseen نعمان عمر یاسین
Journal: Journal of university of Anbar for Pure science مجلة جامعة الانبار للعلوم الصرفة ISSN: ISSN: 19918941 Year: 2011 Volume: 5 Issue: 3 Pages: 50-56
Publisher: University of Anbar جامعة الانبار

Loading...
Loading...
Abstract

Complex problems need long time to be solved, with low efficiency and performance. Therefore, toovercome these drawbacks, the studies went toward the approaches of breaking the problem into independentparts, and treating each part individually in the way that each processing element can execute its part of theproblem simultaneously with the others.Parallel processors are computer systems that consist of multipleprocessing units connected via some interconnection network and the software needed to make the processingunits work together. Parallel processing is divided into three types; Shared, Distributed and Hybrid memorysystems.In this paper, distributed memory systems addressed depending on client/servers principles, the networkcan contain any number of nodes; one of them is a client and the others are servers. The algorithms used hereare capable of calculating the (Started, Terminated, Consumed -CPU and Total Execution- times and CPUusage) of servers and the Client's -CPU and total execution- times. This work addresses an improved approachfor problem subdivision in balanced form and design flexible algorithms to communicate efficiently betweenclient-side and servers-side in the way to overcome the problems of hardware networking components andmessage passing problems. We addressed Matrix-Algebra case-study to display the effect of balance loaddivisionfor this approach. The obtained results are checked and monitored by special programming-checkingsubroutinesthrough many testing-iterations and proved a high degree of accuracy. All of these algorithmsimplemented using Java Language

المشاكل المعقدة تحتاج إلى وقت طویل لكي تحل، مع كفاءة وأداء قلیلین. لذلك، للتخلص من هذه المسا وئ الد ا رسات ذهبت بأتجاه مناهج تجزئةالمشكلة إلى أج ا زء مستقلة، ومعاملة كل ج أ ز على حدة بحیث أن كل عنصر معالجة یمكن أن ینفذ الج أ ز المخصص له من المشكلة بشكل آني معباقي العناصر.المعالجات المتوازیة هي أنظمة حاسبات تحتوي على وحدات متعددة المعالجة مرتبطة مع بعضها عن طریق شبكة ت ا ربط متداخلةوأیضاً الب ا رمجیات المطلوبة لجعل وحدات المعالجة تعمل مع بعضها. المعالجة المتوازیة تقسم إلى ثلاثة أنواع : أنظمة الذاكرة ال (المشتركة،الموزعة والمختلطة).في هذا البحث، تم تناول أنظمة الذاكرة الموزعة أعتماداً على مادئ العمیل/الملقمات، الشبكة یمكن أن تحتوي على أي عدد منالعقد؛ أحداها هو العمیل والبقیة هي ملقمات. الخوارزمیات المستخدمة هنا قادرة على حساب (الأزمنة:البدائیة، المنتهیة، المستغرقة من قبل وحدةالمعالجة المركزیة وكذلك التنفیذ الكلي. أضافة إلى نسبة أستغلال وحدة المعالجة الم ركزیة) للملقمات. وكذلك الزمن المستغرق من قبل وحدة المعالجةالمركزیة والزمن الكلي للعمیل. هذا البحث یتناول منهج مطور لتقسیم المشكلة بهیئة متوازنة وتصمیم خوارزمیات مرنة للأتصال بكفاءة بین جانب-العمیل وجانب-الملقمات بحیث یتم التخلص من مشاكل مادیات مكونات الشبكة ومشاكل ارسال الرسالة. نحن تناولنا هنا حالة د ا رسة جبر المصفوفات لعرض تأثیر تقسیم-الحملالمتوازن لهذا المنهج. تم فحص وم ا رقبة النتائج المستحصلة بواسطة ب ا رمج فرعیة خاصة للفحص من خلال التك ا ر ا رت-الأختباریة وبرهنت درجة عالیة من الدقة.جمیع هذه الخوارزمیات تم تنفیذها بأستخدام لغة جافا.


Article
Development and Evaluation of two Memory Architectures for the Hardware Version of CNN Face Recognizer
تطوير وتقييم نموذجين من معماريات الذاكرة الخاصة بالنموذج المادي لمميز الوجوه المستخدم للشبكات العصبية اللافوفية

Authors: Shefa A. Dawwd شفاء عبدالرحمن داؤد --- Basil Sh. Mahmood باسل شكر محمود
Journal: AL Rafdain Engineering Journal مجلة هندسة الرافدين ISSN: 18130526 Year: 2008 Volume: 16 Issue: 3 Pages: 11-24
Publisher: Mosul University جامعة الموصل

Loading...
Loading...
Abstract

Abstract The design of the proposed Convolutional Neural Network (CNN) architecture for face image recognition takes the constraints on the bandwidth of the communications between memory and processor into the account. The coarse grained parallelism which performed in the bottom layer node's calculations is reduced in consequent manner until the calculation of one simple node in the upper layer is achieved sequentially. Two methods of segmentation are used to buffer the image data required for these parallel to sequential calculations from the image RAM to multi-port RAMs. A comparison between these two methods with respect to the whole number of RAM access required to generate the system recognition code is performed. A speedup of 44 is achieved when the hardware system is implemented with the using of the 1st method of segmentation as compared to a Pentium 4, 2.4 GHz sequential computer software implementation. While a speedup of 88 is achieved when the same hardware system is implemented but with the using of the 2nd segmentation method, compared to the same mentioned sequential computer.Keywords: convolution neural networks, parallel processing, memory architecture.

الخلاصة ان تصميم معمارية الشبكة العصبية اللافوفية المخصصة لمهام تمييز صور الوجوه اخذ هذه مشكلة الى ظهور مشكلة عدم توائم نقل المعلومات بين المعالج والذاكرة بعين الاعتبار.لقد اعتمد التصميم الاساس للمنظومة بكل وحداته على المعيار الذي ينصح باستخدام المعالجة الرقمية المتوازية في طبقات الشبكة الهرمية القريبة من الادخال وتقليل التوازي تدريجيا بالاقتراب من طبقة الاخراج. ولغرض تسريع الحسابات فقد تم تصميم وحدة ادخال وتقطيع المعلومات الصورية اللازمة للتنفيذ المتوازي/ المتوالي المعتمد على المعيار اعلاه بشكل كفوء وذلك اعتمادا على مبدأ الخزن الكاشي لمتجهات الادخال في مخازن FPGA متعددة المرافئ المسماة RAMs واللازمة لبدء الحسابات في المعالجات المتوازية.تم تصميم وحدة ادخال وتقطيع المعلومات الصورية بطريقتين, ثم اجريت مقارنة بين الطريقتين نسبة الى العدد الكلي لمرات الوصول الى الذاكرة واللازم لاكمال الحسابات اللازمة لانتاج شفرة تمييز كل صورة مطبقة على ادخال المنظومة. تم تقييم عمل منظومة الزمن الحقيقي المادية المنفذة من خلال مقارنة انجازها مع منظومة برمجية مصممة لنفس الغرض ومنفذة باستخدام حاسبة شخصية(,Pentium 4 2.4 GHz) . تم الحصول على تسارع بمقدار88 عند استخدام الطريقة الاولى مقارنةً مع تسارع بمقدار 44 تم الحصول عليه باستخدام الطريقة الثانية .


Article
Using Mixed-Radix Method for Representing and Processing Numbers in Parallel Manner
استخدام طريقة الاساس المختلط لتمثيل ومعالجة الارقام باسلوب المعالجة المتوازية

Author: Imad M. Bako عماد متي بكو
Journal: Al-Ma'mon College Journal مجلة كلية المامون ISSN: 19924453 Year: 2010 Issue: 15-E Pages: 52-62
Publisher: AlMamon University College كلية المامون الجامعة

Loading...
Loading...
Abstract

This research presents a method to increase speed by performing computations on numbers in parallel processing manner.The method suggests using Mixed-Radix representation for any number instead of standard Single-Radix representation. Applying this method on computers, especially on those having parallel architectures (having more than one processor), has many advantages. In fact, there is no more need for a waiting time to perform the concept of carrying bits from low-order positions to high-order positions when adding two numbers, or to the borrow concept in subtraction, which must be carried out on any numbering system such as the binary system. Therefore the arithmetic operations will be executed faster. This method depends on Chinese Remainder Theorem (CRT), inaddition to some facts, theorems and algorithms related to this subject.

هذا البحث يقدم طريقه جديدة لزيادة السرعة وذلك بإجراء الحسابات على الإعداد بطريقة المعالجة المتوازية.الطريقة تقترح استخدام التمثيل ذات الأساس المختلط (Mixed-Radix) لتمثيل إي عدد بدل من استخدام التمثيل الاعتيادي ذات الأساس الأحادي.أن تطبيق هذه الطريقة في الحاسبات الإلكترونية وخصوصاً ذات المعماريات المتوازية (التي تحتوي على أكثر من معالج مركزي واحد)، له عدة محاسن، حيث لا يعد هنالك حاجة إلى وقت للانتظار (waiting time) عند تنفيذ مفهوم الاضافة (carry bit) من المرتبة السابقة للعدد الى المرتبة اللاحقة له وذلك عند جمع عددين، أو الى مفهوم الاستدانة (borrow) عند الطرح واللذان لا مفر منهما في اي نظام رقمي وخصوصاً الثنائي، لذلك فان تنفيذ العمليات الحسابية سوف يكون بصورة اسرع.محور البحث بهذه الطريقة يرتكز على نظرية الباقي الصينية (Chinese Remainder Theorem)، اضافة الى بعض المفاهيم الاساسية والحقائق والنظريات والخوارزميات المتعلقة بصلب الموضوع والمستندة على نظرية العدد (number theory).


Article
Multiprocessor Configuration of 8051 Microcontroller Chip
تشكيلة المعالجات المتعددة للتحكم الدقيق 8051

Loading...
Loading...
Abstract

This paper extends the parallel operation of the 8051 microcontroller chip and presents the use of multiple 8051s that are connected to a common loop in a multiprocessor configuration. The 8051 multiprocessing implies many processors acting in some unified manner and connected so that data can be interchanged between them. There is generally a controlling or "talker" microcontroller that directs the activities of the remainder of the loop microcontrollers, or "listeners". One particular characteristic of a talker-listener loop is the frequent transmission of data between the talker and individual listeners. All data broadcast by the talker is received by all the listeners, although often the data is intended only for one or a few listeners. While some times, data is broadcast that is meant to be used by all the listeners. Communication through multiple 8051s use standard UART technology which assign unique addresses to all the listeners using mode 1, in this mode the listeners will waste a lot of processing time rejecting data not addressed to them. Mode 2 and 3 reduces processing time by enabling character reception based upon the state of SM2 in a listener and the state of bit ten in the transmitted character. A single strategy is used to enable a few listeners to receive data while the majority ignores the transmissions. This system is implemented and tested for transmitting data through talker as master and two listeners as slaves.

تعرض هذه المقالة العمل المتوازي لشريحة المسيطر الدقيق 8051 وكذلك توضح استخدام شرائح متعددة مرتبطة مع بعضها في حلقة مألوفة على شكل معالجات متعددة (متوازية). إن مصطلح المعالجات المتعددة يعني ربط المعالجات بطريقة معّرفة حتى يتم تبادل البيانات بينها. بصورة عامة هنالك شريحة مسيطر دقيق "حاكي" والذي يوجه الفعاليات إلى باقي شرائح الحلقة المتوازية أو "المُنْصتين". إن احد الخصائص النوعية لمجموعة (الحاكي – المُنْصت) هو تكرار البيانات بين الحاكي والمُنْصتات الفردية. كل البيانات ترسل بواسطة الحاكي ، تستلم عن طريق كل المنصتين . لكن هذه البيانات قد تكون موجهة لأحد المنصتين او لجميع المنصتين. إن الاتصال خلال الشرائح المتعددة العمل تستخدم تقنية الإرسال والاستلام اللاتزامني (UART) والذي يؤشر عناوين أحادية لكل المُنْصتين باستخدام الطور الأول والذي يستغرق زمن معالجة إضافي لرفض البيانات التي لا تخص المُنْصت المعين. أما الطور الثاني والثالث فلهما قابلية تقليل زمن المعالجة عن طريق تفعيل آلية استلام رمز بالاعتماد على المرجاح (SM2) في المُنْصت وكذلك حالة الثنائي العاشر في الرموز المستلمة. نفذت هذه المنظومة وقد تم اختبارها في عملية إرسال واستلام البيانات بين الحاكي والمُنْصتين ولعدة معدلات ارسال.


Article
Parallel Processing-Parallel Memory Approach for Super Fast Design of Future Microprocessor

Author: Yaakob Karomy. Hanna يعقوب كرومي حنا
Journal: Journal of Engineering and Sustainable Development مجلة الهندسة والتنمية المستدامة ISSN: 25200917 Year: 2013 Volume: 17 Issue: 1 Pages: 81-99
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Loading...
Loading...
Abstract

The early design of the microprocessor (μP) used a single ALU with a single unit of memory. The development of the microprocessor design generates a multi-ALUs microprocessor that is a parallel processing with multi-units of memory.The parallel processing approach will increase the speed of the processing but this speed up is non-linear with increasing the number of processors that are used in the system (μP). However, the efficiency of the parallel processing is non-linear and depends on some factors such as the parallel processing type, the overall design, the programming approach and the applications, yet in general the parallel processing efficiency will decrease by the increase of the number of processors in the system. The history of the Intel μP’s will be used as an example to trace and analyze the growth of the μP. This tracing will disclose that the main future problem in the μP is the storage not the processing of the data. This problem is generated because the shared memory in the parallel processing will capture the processors in the system. The processor in this parallel processing system is not free to use the memory but it shares a single memory with other processors in this system.This paper propose a novel approach designing a parallel memory that gives the processors in the parallel processing system a higher freedom to use the memory and eventually increases the efficiency of each processor, that end result will increase the total speed of the parallel processing system because it will become a parallel processing parallel memory (PPPM) system.This approach will apply to the Intel processor P4, which will show that it is able to increase the speed of the P4 processor for more than four times. These results are used to propose a future design strategy as a first step to implement a super fast processor and then a super fast PC.The proposed processor is PPPM system with 256 ALUs, this processor is expected to enhance the strategy of the management and control units to become a successful super fast processor with speed up to 60 times over the Intel P4.

التصاميم الاولية للمعالجات الدقيقة استخدمت وحدة واحدة فقط من وحدات الحساب والمنطق (ALU ) مع ذاكرة واحدة. التطوير في تصميم المعالج الدقيق خلق معالجات دقيقة بعدة وحدات من الـ (ALU ) تعمل بصورة متوازية مع بعضها البعض مع استخدام عدة وحدات من الذاكرة (multi-units of memory ). طريقة المعالجة المتوازية تزيد من سرعة المعالجة ولكن هذه الزيادة لاتكون زيادة خطية مع الزيادة في عدد المعالجات المستخدمة في النظام. ان كفاءة نظام المعالجة المتوازية ليست خطية بسبب اعتمادها على عوامل اخرى مثل ، نوع المعالجة المتوازية، التصميم النهائي للنظام، نوع البرمجيات مع التطبيقات،لكن بصورة عامة ان كفاءة نظام المعاجة المتوازية تقل كلما ازداد عدد المعالجات في النظام. ان تاريخ تطور المعالجات من نوع (Intel) ستستخدم كمثال لبحث وتحليل نمووتطور المعالج الدقيق. هذا البحث سيكشف ان المشكلة المستقبلية الرئيسية في المعالج الدقيق ستكون في خزن المعلومات وليس في معالجتها. هذه المشكلة تظهر بسبب ان الذاكرة المشتركة في نظام المعالجة المتوازية ستحدد عمل المعالجات في النظام حيث ان المعالج في هذا النظام سيكون ليس حرا في استخدام الذاكرة ولكنه سيتقاسم تلك الذاكرة مع المعالجات الاخرى في النظام.البحث يقترح نهجا جديدا لتصميم الذاكرة المتوازية التي تعطي المعالجات في نظام المعالجة المتوازية حرية اكبر في استخدام الذاكرة مما يزيد من كفاءة كل معالج ، ونتيجة لذلك ستزداد السرعة الكلية للنظام بسبب نظام المعالجة المتوازية والذاكرة المتوازية (PPPM).هذا النهج سيطبق على المعالج الدقيق نوع ( Intel P4)، والذي سوف يزيد سرعة المعالج P4 لأكثر من أربع مرات. هذه النتائج تستخدم لاقتراح استراتيجية تصميم مستقبلية كخطوة أولى لتنفيذ معالج بسرعة فائقة ومن ثم حاسوب شخصي (PC) بمثل هذه السرعة.المعالج المقترح يستخدم نظام معالجة متوازية مع ذاكرة متوازية (PPPM) بـALUs 256 وحدة حساب ومنطق، ومن المتوقع ان هذا المعالج سيعزز استراتيجية وحدات الادارة والسيطرة لتصبح بنجاح معالج فائق السرعة تفوق سرعة معالج (Intel P4) بـ (60) مرة.


Article
A new Sort Algorithm for Multi Core parallel Computers
خوارزمية فرز جديدة في تعدد نواة للحاسبات المتوازية

Authors: Maisa'a Abid Ali K ميساء عبد علي خضير --- Abdul Monem S. Rahma عبد المنعم صالح رحمة
Journal: Iraqi Journal of Information Technology المجلة العراقية لتكنولوجيا المعلومات ISSN: 19948638/26640600 Year: 2018 Volume: 9 Issue: 1 اللغة الانكليزية Pages: 65-81
Publisher: iraqi association of information الجمعية العراقية لتكنولوجيا المعلومات

Loading...
Loading...
Abstract

Sorting is one of the basic problems of tremendous data for computers. In the past computer processes were executed on a single processor and this took a long time. To solve this problems computers used multi cores, to decrease the amount of time taken for solving these operations. The advent of the internet allowed people to pool their processing power; parallel processing. This paper offers such sort algorithms for parallel processing. The proposed algorithm in this paper sorts random numbers and save them in a text file. It uses three parameters: number cutting, multi core, and times. The file is divided in a number of matrix. And uses two main operations: the first operation merges a column with the adjacent column, and the second operation sorts ascending and shared memory in cores P1, P2, P3, and P4, and computes time/millisecond for each process. This algorithm is executed in a computer having multiply cores; CPU 0, CPU 1, CPU 2, and CPU 3. The outcome of this algorithm is fast, efficient, and produces optimal results; when the number of processors increase, execution time is decrease.

ان احد المشاكل الاساسية في عملية فرز البيانات الكبيرة جدا في الحاسبة القديمة ذات معالج واحد قد تاخذ وقت طويل في عملية تنفيذ البيانات. ولحل هذه المشاكل تم استخدام حاسبات متعددة النواة، لتقليل كمية الوقت المستغرق لحل هذه العمليات. وان وصول انتشار الانترنيت واكثر الناس تعمل باتجاه المعالجات متوازية. قدم هذا البحث نوع من خوارزمية الفرز في المعالجات المتوازية ، لذلك اقترح البحث خوارزمية فرز الارقام العشوائية وخزنها في ملف .txt وتم استخدام ثلاث براميترات هي تقطيع الارقام ، الوقت، تعدد النواة. وممكن ان تقسم هذه الارقام العشوائية بواسطة عددمن الاعمدة داخل مصفوفة.واستخدام عمليتين رئيسيتين وهي : العملية الاولى دمج كل عمودين متجاورة، والعملية الثانية عملية فرز وترتيب تصاعدي واستخدام تقسيم الذاكرة في تعدد النواة في البروسيسرات الاول، والثاني، والثالث، والرابع، وتم حساب الوقت بالملي ثانية لكل بروسيسر، هذه الخوارزمية تنفذ داخل حاسبات تشمل وحدة معالجة مركزية 0، وحدة معالجة مركزية1، وحدة معالجة مركزية2، و وحدة معالجة مركزية3.النتائج التي تم الحصول من الخوارزمية هي جيدة وسريعة وكفوءة وكانت النتائج مثالية ، عندما تزداد عدد المعالجات، يقل وقت التنفيذ.

Listing 1 - 7 of 7
Sort by
Narrow your search

Resource type

article (7)


Language

English (5)

Arabic and English (2)


Year
From To Submit

2018 (1)

2017 (1)

2013 (1)

2011 (2)

2010 (1)

More...