research centers


Search results: Found 2

Listing 1 - 2 of 2
Sort by

Article
SUGGETIONS TO IMPROVE THE EFFICIENCY OF ASSOCIATION RULESTECHNIQUES IN DATA MINING
مقترح لتحسين كفاءة تقنيات قوانين الارتباط في تنقيب البيانات

Authors: Hillal Hadi Salih --- Soukaena Hassan Hash --- Shaimaa Akram Hassan
Journal: AL-TAQANI مجلة التقني ISSN: 1818653X Year: 2010 Volume: 23 Issue: 4 Pages: 32-41
Publisher: Foundation of technical education هيئة التعليم التقني

Loading...
Loading...
Abstract

Data mining is a process that uses a variety of data analysis tools to discover patterns and relationships that can be hidden among vast amount of data. From these businesses and organizations can make valid predictions about future trends in all areas of business. Association rule mining is a typical approach used in data mining domain for uncovering interesting trends, patterns and rules in large datasets This research concentrates on one particular aspect to improve the efficiency of the association rules technique in data mining by the following:1.With databases have large set of items, it suggested to find the frequent itemsets by using depth search. In detail that done by finding the largest frequent itemset and then finding all the sub frequent itemsets from it. This proposal aim will speed up the process of finding frequent itemsets.2.Classify the frequent itemsets to three classes closed frequent, maximal frequent and normal frequent. This proposal classification is important in the analysis process to support and strength the prediction with association rules.

تنقيب البيانات هي عملية استخدام أنواع مختلفة من طرق تحليل البيانات لاكتشاف الانماط والعلاقات المخبؤة وسط كم هائل من البيانات والتي من خلالها تتمكن الشركات والتعاملات المالية من التنبؤ المستقبلي المقبول في مختلف الجوانب.قوانين الارتباط هي احدى التقنيات المستخدمة في تنقيب البيانات لاكتشاف الصيغ والقوانين المهمة في قواعد البيانات الكبيرة في هذا البحث تم التركيز على تحسين كفاءة قوانين الارتباط من خلال:-تم اقتراح ايجاد مجموعة العناصر المتكررة في قواعد البيانات التي تحتوي على عدد كبير من العناصر باستخدام تقنية البحث بالعمق لايجاد اطول مجموعة عناصر متكررة ومن خلالها يتم ايجاد كل العناصر المتكررة الجزئية بهدف زيادة السرعة.-تصنيف مجموعة العناصر المتكررة الى ثلاث مجاميع وهي: المتكررة المغلقة والمتكررة العظمى والمتكررة الطبيعية. هذا التصنيف المقترح ذو اهمية في عملية التحليل لدعم وتقوية التنبؤ بواسطة قوانين الارتباط.


Article
Hiding Sensitive Frequent Itemsets over Privacy Preserving Distributed Data Mining

Authors: Sufyan T. F. Al-Janabi --- Alaa Kh. Juma'a --- Nazar A. Ali
Journal: AL-Rafidain Journal of Computer Sciences and Mathematics مجلة الرافدين لعلوم الحاسوب والرياضيات ISSN: 18154816 Year: 2013 Volume: 10 Issue: 1 Pages: 91-105
Publisher: Mosul University جامعة الموصل

Loading...
Loading...
Abstract

Data mining is the process of extracting hidden patterns from data. One of the most important activities in data mining is the association rule mining and the new head for data mining research area is privacy of mining. Privacy preserving data mining is a new research trend in privacy data for data mining and statistical database. Data mining can be applied on centered or distributed databases. Most efficient approaches for mining distributed databases suppose that all of the data at each site can be shared. Privacy concerns may prevent the sites from directly sharing the data, and some types of information about the data. Privacy Preserving Data Mining (PPDM) has become increasingly popular because it allows sharing of privacy sensitive data for analysis purposes. In this paper, the problem of privacy preserving association rule mining in horizontally distributed database is addressed by proposing a system to compute a global frequent itemsets or association rules from different sites without disclosing individual transactions. Indeed, a new algorithm is proposed to hide sensitive frequent itemsets or sensitive association rules from the global frequent itemsets by hiding them from each site individually. This can be done by modifying the original database for each site in order to decrease the support for each sensitive itemset or association rule. Experimental results show that the proposed algorithm hides rules in a distributed system with the good execution time, and with limited side effects. Also, the proposed system has the capability to calculate the global frequent itemsets from different sites and preserves the privacy for each site.

إن عملية تنقيب البيانات هي عبارة عن استخلاص الأنماط المخفية من البيانات. وإن التنقيب عن العلاقات الرابطة يعد واحدا من أهم فعاليات تنقيب البيانات والتي أصبح التوجه الحديث للباحثين فيها هو الحفاظ على سرية تلك البيانات المنقب عنها. فالتنقيب المحافظ على خصوصية البيانات هو من أهم توجهات البحوث العلمية الجديدة في خصوصية البيانات وقواعد البيانات الإحصائية. ويمكن تطبيق فعاليات التنقيب هذه على قواعد البيانات المركزية والموزعة. ورغم أن أكثر الأساليب فعالية لقواعد البيانات الموزعة تفترض التنقيب في البيانات التي يمكن تشاركها بين المواقع المختلفة، غير أن تلك الأساليب لم يعد بالإمكان تطبيقها في كثير من الأحيان بسبب المخاوف المتعلقة بخصوصية منع المواقع من تبادل البيانات بشكل مباشر، أو تبادل بعض أنواع المعلومات حول البيانات. لذلك أصبح للتنقيب المحافظ على خصوصية البيانات (PPDM) شعبية متزايدة لأنه يسمح بتبادل البيانات الحساسة الخصوصية لأغراض التحليل.في هذا البحث، تم التصدي لمشكلة الحفاظ على خصوصية التنقيب للعلاقات الرابطة في قاعدة بيانات موزعة أفقيا من خلال اقتراح نظام لحساب العناصر ((itemsets العامة المتكررة أو العلاقات الرابطة من مواقع مختلفة دون الكشف عن المعاملات الفردية. كما نقدم هنا أيضا خوارزمية جديدة لإخفاء هذه العناصر المتكررة الحساسة أو قواعد الرابطة الحساسة من خلال إخفائها في كل موقع على حدة. ويمكن أن يتم ذلك عن طريق تعديل قاعدة البيانات الأصلية لكل موقع من أجل خفض الدعم لكل من العناصر الحساسة أو العلاقات الرابطة. النتائج التي تم الحصول عليها من تطبيق الخوارزمية المفترضة تشير إلى قدرتها على إخفاء العناصر المتكررة الحساسة بوقت تنفيذ جيد وبأقل تأثيرات جانبية. كما أن النظام المفترض استطاع الحصول على العناصر المتكررة العامة للبيانات (Global Frequent Itemset) الموزعة على عدة مواقع مع الحفاظ على خصوصية كل موقع.

Listing 1 - 2 of 2
Sort by
Narrow your search

Resource type

article (2)


Language

English (2)


Year
From To Submit

2013 (1)

2010 (1)