research centers


Search results: Found 11

Listing 1 - 10 of 11 << page
of 2
>>
Sort by

Article
An Efficient Association Rules Algorithms for Medical Test Analysis

Authors: Ahmed Tariq Sadiq --- Alaa Sameer Ali
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2016 Volume: 34 Issue: 4 Part (B) Scientific Pages: 540-546
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

Data Mining denotes mining knowledge from hugequantity of data. All algorithms of association rules mining include ‘first finding frequency of item sets, which accept a minimum support threshold, and then calculates confidence percentage for all k-item sets to construct robust association rules’. The trouble is there are some of algorithms that need more time for compute minimum support, minimum confidence and extraction larger item. In this paper one algorithm is proposed (enhanced reduces items Apriori algorithm) to reduce execution time. The proposed algorithm purpose to introduce algorithm to mine association rules to obtain fast algorithm by reducing execute time. Due to many experiments in (enhanced reduces items Apriori algorithm), this algorithm is very fast compared with (topk-rules and topk-non redundant rules) algorithms.


Article
Pruning of Apriori-Algorithm’s Pruning Steps
تــشـــــذيب خطوات الــتــشــــذيب في خوارزمية الأبريوري

Author: Ala H. Al-Hamamy
Journal: Al-Rafidain University College For Sciences مجلة كلية الرافدين الجامعة للعلوم ISSN: 16816870 Year: 2007 Issue: 21 Pages: 1-16
Publisher: Rafidain University College كلية الرافدين الجامعة

Loading...
Loading...
Abstract

Association rules mining is the main task of data mining. It consists of two compulsory steps, the first step is discovery of frequent itemsets, and the second one is extracting the rules from the mined frequent itemsets. The first step is massive computational step. There are many algorithms presented to complete this step, but all of these algorithms are variations of the Apriori algorithm, which is the state of the art. Apriori requires a priori knowledge to generate the frequent itemsets and involves two time-consuming pruning steps to exclude the infrequent candidates and hold frequents. The first pruning operation is degenerating each of the (k+1)-itemsets to its k-itemset subsets. The second pruning operation is support counting for each candidate passed the first exam. This research improves Apriori algorithm by pruning its pruning steps. It abridges the pruning steps to TID lists intersection and items union operations by taming the problem of frequent itemsets mining to lattice theory. It excludes the neediness to multi-scanning the database; instead, it scans the database only once.Keywords: Data Mining, Association Rules, Apriori Algorithm, Lattice

استكشاف قواعد الأرتباط هو واحد من اهم اغراض تعدين البيانات. لأستكشاف قواعد الأرتباط في قواعد البيانات، هنالك اجرائين لازمين هما: (1) استكشاف المجموعات الكبيرة للعناصر ، (2) واستخراج القواعد من هذه المجاميع المستكشفة. الأجراء الأول اعقد بكثير من الثاني والذي يحتاج الى اجراءات حسابية كبيرة. هنالك العديد من الخوارزميات المقترحة لانجاز الأجراء الأول، كلها تعتبر تنوعا من خوارزمية قياسية تدعى ابريوري. خوارزمية ابريوري تحتاج الى معرفة مسبقة لتوليد مستوى جديد من مجموعات العناصر الكبيرة. انها تولد مجموعات عناصر مرشحة لتكون كبيرة. لأستبعاد المرشحات التي لاتتواقر فيها الشروط،، الخوارزمية تستخدم عمليتي تشذيب معقدة؛ الأولى هي تهديم مجموعة العناصر


Article
Design and Implement Proposed Crime Analysis using Modified Association Rule

Authors: Emad K. Jabar --- Soukaena H. Hashem --- Enas M. Hessian
Journal: Iraqi Journal of Information Technology المجلة العراقية لتكنولوجيا المعلومات ISSN: 19948638/26640600 Year: 2014 Volume: 6 Issue: 2 اللغة الانكليزية Pages: 48-60
Publisher: iraqi association of information الجمعية العراقية لتكنولوجيا المعلومات

Loading...
Loading...
Abstract

This research presents a proposal to advance crime analysis that through employee data mining association rules on crime’s data with a proposed strategy consists of three levels, each level present suggestion to suite and consistence crime analysis and predictions. First level will deal with the challenges in mining crime data, where the last often comes from the free text field. While free text fields can give the newspaper columnist, a great story line, converting them into data mining attributes is not always an easy job. The proposal will look at how to arrive at the significant attributes for the data mining systems. That through suggested view organized the crime to three dimensions these are crime attributes, criminal attributes and geo-crime attributes. Second level will use AR (apriori) as a miner technique of crimes, but apriori in case of large dataset is not efficient, also has no security to protect the mined data from unauthorized users. The proposal modify apriori (MAR) to avoid the degradation of performance with crime analysis by reduce unimportant and redundant transactions. Advance MAR with modest suggestion to be secure. Third level, applying the MAR on each dimension separately then according need and on demand of correlate among these dimensions, the correlation done using proposed mixing. The proposal applied on real crime data from a dependable sheriff’s office depended in our previous work (reference 6), then a comparison done between the previous and current work. The results of comparisons show the current work advance previous work by optimizing time and space consumed in mining through apply suggested MAR in current work, where the previous work apply traditional apriori AR. Also the proposed MAR give precision in prediction since it omitting the redundant and ineffective data.

يقدم هذا البحث اقتراحا لتعزيز تحليل الجريمة من خلال قواعد ارتباط تعدين البيانات، تتكون الاستراتيجية المقترحة من ثلاثة مستويات، كل مستوى يقدم اقتراح مناسبة لتحليل الجريمة والتنبؤ بها. يتناول المستوى الأول بيانات الجريمة في مجال التعدين، وهذا المستوى يبحث في كيفية التوصل إلى سمات هامة للجريمة التي تستخدم في أنظمة تعدين البيانات. المقترح ينظيم بيانات الجريمة في ثلاثة أبعاد، سمات الجريمة، سمات المجرم والسمات الجغرافية للجريمة. والمستوى الثاني استخدام قواعد الارتباط (نحو استدلالي) كأسلوب منجم للجرائم، ولكن في حالة البيانات الكبيرة هذه الطريقة ليست فعالة، وأيضا لا توجد حماية للبيانات المعدنه من المستخدمين الغير مخوليين. البحث يقوم باقتراح (MAR) لتجنب تدهور الأداء مع تحليل الجريمة من خلال الحد من المعاملات غير المهمه والزائدة عن الحاجة. المستوى الثالث تطبق MAR على كل بعدا بشكل منفصل وفقا للحاجة والطلب على وجود علاقة بين هذه الأبعاد. الطريقة المقترحه تم تطبيقها على بيانات الجريمة الحقيقية من مكتب مأمور شرطة وتم الاعتماد على هذه البيانات في العمل السابق (مرجع 6)، ثم مقارنة ذلك بين العمل السابق والحالي. نتائج المقارنات إظهرت ان العمل الحالي يتسم بفعالية أكثر من العمل السابق عن طريق الاستفادة المثلى من الوقت والمساحة المستهلكة في مجال التعدين, كذلك الدقة في التنبؤ لأنه بحذف البيانات المكررة وغير فعالة.

Keywords

Crime Analysis --- Criminal --- Data Mining --- AR --- apriori.


Article
An Improved Distributed Association Rule Algorithm
خوارزمية علاقة ترابطية موزعة محسنة

Authors: Saad K. Majeed --- Hussein K. Abbas
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2010 Volume: 28 Issue: 18 Pages: 5695-5710
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

All Distributed association rules mining (DARM) algorithms which bases on Apriori algorithm don't have an efficient message optimization technique, so they exchange numerous messages during the mining process which needs several distributed scan operations to the distributed warehouses or distributed databases to get the support values, also the performance of these DARM algorithms decreased with increasing communication cost especially when increasing the number ofdistributed mining sites as well as the itemsets to be mined become more larger . The aim of this work is to improve association rules in distributed data mining by proposing a new efficient method of distributed association rule mining, which reduce the average size of records transferred, datasets and messages transferred without needto any distributed scan to the distributed data warehouses or distributed databases to retrieve the values of the support values of these datasets. The results obtained from the proposed method prove that the proposed method is better than the existing algorithms by reducing communications costs, centralstorage requirements, enhanceperformance and achieves high degree of scalability compared with the existing algorithms.

كل خوارزميات تعدين االعلاقات الترابطية الموزعة والمعنمدة على مبدأ خوارزمية الابرايوري لاتمتلك تقنيات كفوءة لتحقيق امثلية تناقل الرسائل، لذلك فانها تتطلب تبادل العديد من الرسائل اثناء عملية التعدين والتي تحتاج الى القيام بالعديد من عميات المسح الموزع لمخازن البيانات الموزعة او قواعد البيانات الموزعة لاسترجاع قيم الدعم ، كذلك فان اداء هذه الخوارزميات يتناقص مع زيادة كلف الاتصال وخصوصا عند زيادة عدد مواقع التعدين الموزعة بالاضافة الى ذلك عندما يصبح حجم العناصر المراد تعدينها اكبر. الهدف من البحث هو تحسين العلاقات الترابطية في تعدين البيانات الموزعة عن طريق استحداث طريقة كفوءة لتعدين العلاقات الترابطية الموزعة، تتولى تقليل حجم معدل القيود المنقولة، مجاميع البيانات والرسائل المتبادلة دون الحاجة الى اجراء مسح موزع لمخازن البيانات الموزعة او قواعدالبيانات الموزعة لاسترجاع قيم الدعم الخاص بمجموعة البيانات. النتائج المستحصلة من الطريقة المقترحة تبين افضلية عملها مقارنة بما هو موجود من الخوارزميات الموزعة وذلك بتحقيقها تقليل لكلفة الاتصال، متطلبات الخزن المركزي، وقت الحسابات، تحسين الاداء وتطبيق درجة عالية من التوسعية مقارنة بما هو موجود من الطرق


Article
An Electronic System for Summer Training Students Distribution in Organizations with Comparative Study of Association Rule Algorithms
نظام الكتروني لتوزيع طلبة التدريب الصيفي على المنظمات مع حالة مقارنة لخوارزميات قواعد الارتباط

Authors: Anhar Khairualdeen Mohammed أنهار خيرالدين محمد --- Suhair Abid Dawood سهير عبد داؤود
Journal: Tikrit Journal of Pure Science مجلة تكريت للعلوم الصرفة ISSN: 18131662 Year: 2017 Volume: 22 Issue: 2 Pages: 125-139
Publisher: Tikrit University جامعة تكريت

Loading...
Loading...
Abstract

The training of students is considered as one of the most promising forms of training to inform students with the reality of practical environment and what they require from serious and exact work. It may give the chance to other public sector organizations to be acquainted with the students' abilities and skills, in addition to the benefits of informing youths to join summer vocation. In order to solve the problem of students distribution to organizations and guarantee the equivalency between students desires and the capacity of governmental and privates offices, some algorithms were used to mine up data to uncover essential hidden relationships with huge data, & Distributed Database has been designed for summer training . The data mining were also used to set reports that may refer to the delicate number of students required for training according to the specializations in the four departments of the College of Administration and Economics (application environments) with the number of nominee students for training in these departments using (oracle 11g.).

تدريب الطلبة خلال الإجازة الصيفية أحد أشكال التدريب الهادفة إلى تعريف الطلاب بواقع البيئة العملية وما تحتاج إليه من جد وانضباط ، كما أنه من جهة أخرى يتيح الفرصة لمؤسسات القطاع العام والخاص للتعرف على إمكانيات الطلاب ومهاراتهم ، هذا بالإضافة إلى فوائده فيما يتعلق بتوجيه الشباب نحو الاستفادة من الإجازة الصيفية .ولحل مشكلة توزيع الطلاب على المنظمات ولضمان التوافقية بين رغبات الطلبة واستيعاب الدوائر الحكومية والأهلية تم استخدام بعض من خوارزميات تنقيب البيانات (Aprior, Predictive) لاكتشاف علاقات هامة مخفية في مجموعة البيانات الضخمة، وتم تصميم قاعدة بيانات موزعة بكل مايتعلق بالتدريب الصيفي فضلاً عن استخدام مستودع البيانات(DW) لغرض إعداد تقارير يتضح من خلالها أعداد الطلبة المطلوب تدريبهم في المنظمات وحسب التخصصات لأربعة اقسام من كلية الإدارة والاقتصاد (بيئة التطبيق) مع أعداد الطلبة المرشحين للتدريب في كل قسم باستخدام برنامج (Oracle 11g.)


Article
Proposed Approach for Analysing General Hygiene Information Using Various Data Mining Algorithms
منهج مقترح لتحليل المعلومات الصحية العامة باستخدام خوارزميات تنقيب بيانات متعددة

Authors: Tareef K. Mustafa طريف كامل مصطفى --- Mustafa S. Abd مصطفى سلمان عبد
Journal: Iraqi Journal of Science المجلة العراقية للعلوم ISSN: 00672904/23121637 Year: 2017 Volume: 58 Issue: 1B Pages: 337-344
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

General medical fields and computer science usually conjugate together to produce impressive results in both fields using applications, programs and algorithms provided by Data mining field. The present research's title contains the term hygiene which may be described as the principle of maintaining cleanliness of the external body. Whilst the environmental hygienic hazards can present themselves in various media shapes e.g. air, water, soil…etc. The influence they can exert on our health is very complex and may be modulated by our genetic makeup, psychological factors and by our perceptions of the risks that they present. Our main concern in this research is not to improve general health, rather than to propose a data mining approach that will eventually give a more clear understanding and automotive general steps that can be used by the data analyser to give more enhanced and improved results than using typical statistical tests and database queries. This research proposes a new approach involving 3 algorithms selected from data mining which are association rule mining, Apriori algorithm and Naïve Bayesian consequently, to offer a final improved decision support results that can serve the researchers in their fields.

حقول الطب العامة وعلوم الحاسوب عادة ما تنتج معلومات جديرة بالاهتمام عند تسخيرهما معا بإستثمار التطبيقات, البرامجيات, والخوارزميات الخاصة بتنقيب البيانات. عنوان البحث الحالي يتضمن مفردة الصحة العامة والتي من الممكن توصيفها بانها مبادئ إدامة النظافة لعموم جسم الإنسان. بينما تتضمن مبادئ الحفاظ على البيئة تجنب مخاطر التلوث البيئي بأشكال ومظاهر عديدة مثل التربة, الماء, الهواء...الخ. إن التأثيرات التي تفرزها هذه العوامل البيئية على صحتنا العامة متشعبة وقد تؤثر علينا بعدة أشكال كأن تكون جينية, نفسية, أو اي شكل اخر إعتماداً على منظورنا البحثي. في هذا البحث لاينصب اهتمامنا البحثي في العناية بالصحة العامة بقدر ما يكون اهتمامنا باقتراح منهج تنقيب بيانات يصب بالنهاية في صالح البحثين الصحي والمعلوماتي, كما ويعطي صورة أكثر وضوحا مع خطوات الية مبسطة يتبعها الباحث الطبي والصحي حتى وإن لم يكن ضليعا بعلوم تنقيب البيانات, بحيث يعطي نتائج أكثر عمقا ودقة مما لو استخدم الادوات الاحصائية التقليدية الشائعة. البحث الحالي يقترح نهجا يتضمن دمج ثلا ث خوارزميات تعمل بالتعاقب على البيانات الصحية لتعطينا نتائج باهرة لم تكن ضمن خطة الباحث عند تصميمه تجاربه وتوفر له الية اتخاذ قرارات تخدم مجال بحثه.


Article
Miner Alerts Module to Generate Itemsets Based on FP-Growth Algorithm Improvement

Authors: Karim H. Al-Saedi --- Raghda Abd Al-Rab
Journal: Al-Mustansiriyah Journal of Science مجلة علوم المستنصرية ISSN: 1814635X Year: 2018 Volume: 29 Issue: 1 Pages: 114-117
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Loading...
Loading...
Abstract

Data mining techniques becomes very useful for all areas, Which gives impressive results and accurate. It is can be works with huge data and variance type’s data. The intrusion detection system (IDS) has huge numbers of alerts without classify and almost alerts be false positive. In this paper, we proposed a new miner module to generating Itemsets of IDS alerts by using FP-Growth Algorithm Improvement, which it is produce from compact Fp growth algorithm with Apriori algorithm. This new module contains three phases: Compute support, Resort, and Generating K-Itemsets. It is applied on Darpa 1999 datasets to generating Alerts sets based on IDS Snort. The obtain result was very useful because it is make the alerts ready to classify.

أصبحت تقنيات تعدين البيانات مفيدة جدا ولاسيما في كافة المجالات بإمكانها إعطاء نتائج مؤثره ودقيقة, حيث تعمل مع بيانات كبيرة و متنوعة .نظام كشف التسلل يمتلك أعداد كبيرة من التنبيهات الغير مصنفة والتي اغلبها تكون كاذبة . في هذا البحث تم اقتراح موديل جديد لتوليد عناصر نظام كشف التسلل باستخدام خوارزمية FAI المطورة الناتجة من دمج خوارزمية Fp growth مع خوارزمية Apriori .يحتوي هذا الموديل على ثلاثة مراحل : احتساب تكرار العناصر, أعادة ترتيب العناصر وتوليد العناصر.تم التطبيق على بيانات قياسية وتم الحصول على نتائج مفيدة جدا لأنها تجعل التنبيهات جاهزة للتصنيف.


Article
Apriori Method of Mining Secure Data in Social Media
طريقة Apriori لتعدين البيانات الأمنة في التواصل الأجتماعي

Author: Zahraa Raji Mohi زهراء راجي محي
Journal: Journal of university of Anbar for Pure science مجلة جامعة الانبار للعلوم الصرفة ISSN: ISSN: 19918941 Year: 2019 Volume: 13 Issue: 1 Pages: 41-49
Publisher: University of Anbar جامعة الانبار

Loading...
Loading...
Abstract

As can be seen all around us, social media sites such as Facebook, Twitter, YouTube and Flickr and other became more importance grow rapidly in the last few years. This growth in social media sites has led to increase of information generated and circulated between individuals, this information significance in the companies and institutions works and also for individuals, for this it is important to analyze and classify data by determining keywords and main sentences which lead companies to manage their works more better with present and possibly clients. However, social media data may be contain various types of unwanted and maleficent spammer or hacker actions. So, there is a critical need in the social media network and society, industry for social media security. In this paper, we choose Apriori method for mining and classifying social media data and take a Facebook to be a case study for social media data then after classifying and mining data applying RSA algorithm which is most popular and easer to implement secure data and use it usefully in the company’s work.

كما نرى من حولنا فأن مواقع التواصل الأجتماعي المتمثلة بFacebook Youtube, ,Twitter, Flicker وغيرها اصبحت تشكل اهمية كبيرة في حياتنا وازدادت بالنمو خلال السنوات الأخيرة . ان هذا النمو في مواقع التواصل الاجتماعي ادى الى زيادة كمية المعلومات والبيانات المتولدة والمتداولة بين الافراد , هذه المعلومات مهمه في اعمال الشركات والمؤسسات وحتى الأفراد, لذلك من الضروري تحليل البيانات وتصنيفها وتحديد الكلمات المفتاحية والجمل المعبرة مما يؤدي بالشركات الى ادارة اعمالها بشكل افضل مع الزبائن الحاليين والمحتمليين.وفي نفس الوقت فان بيانات التواصل الاجتماعي قد تحتوي على انواع عديدة من القرصنة والبرامج الخبيثة والاعمال الغير مرغوبة. لذا فان شبكات التواصل الاجتماعي والمجتمع والصناعة والاعمال بحاجة ماسة الى استخدام بيانات تواصل اجتماعي امنة. وفي هذا البحث قد اختيرت طريقة الApriori لتعدين وتصنيف بيانات التواصل الاجتماعي وقد اخذت Facebook كحالة لدراسة بيانات التواصل الاجتماعي بعد تصنيف البيانات وتعدينها تطبيق خوارزمية RSA الشائعة والسهلة الاستخدام لتأمين البيانات المصنفة واستخدامها بصورة مفيدة في اعمالهم.


Article
Building a Strong Frequent Patterns for Using the Web
البناء القوي للأنماط المتكررة في استخدام شبكة الانترنت

Authors: . Hayder Mahmood Salman حيدر محمود سلمان --- Nidhal Ali Hussein نضال علي حسين
Journal: Alustath الاستاذ ISSN: 0552265X 25189263 Year: 2012 Issue: 202 Pages: 25-44
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Web usage mining is a type of web mining, which exploits data mining techniques to discover valuable information from navigation behavior of World Wide Web users. The first phase of web usage mining is the data pre_processing phase, which includes the session reconstruction operation from server logs. Session reconstruction success directly affects the quality of the frequent patterns discovered in the next phase. In reactive web usage mining techniques, the source data is web server logs and the topology of the web pages served by the web server domain. Other kinds of information collected during the interactive browsing of web site by user, such as cookies or web logs containing similar information, are not used. The next phase of web usage mining is discovering frequent user navigation patterns. In this phase, pattern discovery methods are applied on the reconstructed sessions obtained in the first phase in order to discover frequent user patterns. In this paper, we propose a frequent web usage pattern discovery method that can be applied after session reconstruction phase. In order to compare accuracy performance of session reconstruction phase and pattern discovery phase, we have used an agent simulator, which models behavior of web users and generates web user navigation as well as the log data kept by the web server.


Article
Multi-Document Text Summarization using Fuzzy Logic and Association Rule Mining
تلخيص النصوص المتعددة باستخدام المنطق الضبابي مع تعدين القوانين المشتركه

Author: Suhad Malallah سهاد مال الله
Journal: Al-Rafidain University College For Sciences مجلة كلية الرافدين الجامعة للعلوم ISSN: 16816870 Year: 2017 Issue: 41 Pages: 241-258
Publisher: Rafidain University College كلية الرافدين الجامعة

Loading...
Loading...
Abstract

Information is very necessary. The huge quantity of information on the Internet makes text summarization research increase rapidly. Text summarization is the process of choosing significant sentences from one or multi-document without losing the main ideas of the original text. In this paper a new multi-document English text summarization was proposed, which is based on linguistic and statistical features of the sentences. The extracted features fed to the fuzzy logic system, then the Apriori algorithm used for association rule extraction. The proposed model is performed using dataset supplied by the Text Analysis Conference (TAC-2011) for English documents. The results were measured by using Recall-Oriented Understudy for Gisting Evaluation(ROUGE). The obtained results support the effectiveness of the proposed model.

بالنظر لكثرة المعلومات الموجودة في شبكة الاتصالات وأهميتها أزداد ألاهتمام بالبحوث التي تتناول تلخيص النصوص. عملية التلخيص أما أن تكون لنص واحد أو لمجموعة من النصوص بحيث تحافظ عملية التلخيص على الافكار الاساسية للنصوص الملخصة. في هذا البحث تم أقتراح طريقة تعتمد على أستخلاص الخواص اللغوية والاحصائية للجمل ومن ثم تقدم هذة لاعطاها تصنيفات بعدها يتم تقديمها الخصائص للمنطق الضبابي ((Fuzzy logic لخوارزمية Apriori لغرض أستخراج القوانين الخاصة بتصنيف الجمل التي تكون اما مهمة أو غير مهمه. كما تم حساب النتائج باستخدام ( (TAC-2011تم تطبيق البرنامج على قاعده بيانات(ROUGE) Recall-Oriented Understudy for Gisting Evaluation

Listing 1 - 10 of 11 << page
of 2
>>
Sort by
Narrow your search

Resource type

article (11)


Language

English (10)


Year
From To Submit

2019 (1)

2018 (1)

2017 (3)

2016 (1)

2014 (1)

More...