research centers


Search results: Found 2

Listing 1 - 2 of 2
Sort by

Article
Hiding Sensitive Frequent Itemsets over Privacy Preserving Distributed Data Mining

Authors: Sufyan T. F. Al-Janabi --- Alaa Kh. Juma'a --- Nazar A. Ali
Journal: AL-Rafidain Journal of Computer Sciences and Mathematics مجلة الرافدين لعلوم الحاسوب والرياضيات ISSN: 18154816 Year: 2013 Volume: 10 Issue: 1 Pages: 91-105
Publisher: Mosul University جامعة الموصل

Loading...
Loading...
Abstract

Data mining is the process of extracting hidden patterns from data. One of the most important activities in data mining is the association rule mining and the new head for data mining research area is privacy of mining. Privacy preserving data mining is a new research trend in privacy data for data mining and statistical database. Data mining can be applied on centered or distributed databases. Most efficient approaches for mining distributed databases suppose that all of the data at each site can be shared. Privacy concerns may prevent the sites from directly sharing the data, and some types of information about the data. Privacy Preserving Data Mining (PPDM) has become increasingly popular because it allows sharing of privacy sensitive data for analysis purposes. In this paper, the problem of privacy preserving association rule mining in horizontally distributed database is addressed by proposing a system to compute a global frequent itemsets or association rules from different sites without disclosing individual transactions. Indeed, a new algorithm is proposed to hide sensitive frequent itemsets or sensitive association rules from the global frequent itemsets by hiding them from each site individually. This can be done by modifying the original database for each site in order to decrease the support for each sensitive itemset or association rule. Experimental results show that the proposed algorithm hides rules in a distributed system with the good execution time, and with limited side effects. Also, the proposed system has the capability to calculate the global frequent itemsets from different sites and preserves the privacy for each site.

إن عملية تنقيب البيانات هي عبارة عن استخلاص الأنماط المخفية من البيانات. وإن التنقيب عن العلاقات الرابطة يعد واحدا من أهم فعاليات تنقيب البيانات والتي أصبح التوجه الحديث للباحثين فيها هو الحفاظ على سرية تلك البيانات المنقب عنها. فالتنقيب المحافظ على خصوصية البيانات هو من أهم توجهات البحوث العلمية الجديدة في خصوصية البيانات وقواعد البيانات الإحصائية. ويمكن تطبيق فعاليات التنقيب هذه على قواعد البيانات المركزية والموزعة. ورغم أن أكثر الأساليب فعالية لقواعد البيانات الموزعة تفترض التنقيب في البيانات التي يمكن تشاركها بين المواقع المختلفة، غير أن تلك الأساليب لم يعد بالإمكان تطبيقها في كثير من الأحيان بسبب المخاوف المتعلقة بخصوصية منع المواقع من تبادل البيانات بشكل مباشر، أو تبادل بعض أنواع المعلومات حول البيانات. لذلك أصبح للتنقيب المحافظ على خصوصية البيانات (PPDM) شعبية متزايدة لأنه يسمح بتبادل البيانات الحساسة الخصوصية لأغراض التحليل.في هذا البحث، تم التصدي لمشكلة الحفاظ على خصوصية التنقيب للعلاقات الرابطة في قاعدة بيانات موزعة أفقيا من خلال اقتراح نظام لحساب العناصر ((itemsets العامة المتكررة أو العلاقات الرابطة من مواقع مختلفة دون الكشف عن المعاملات الفردية. كما نقدم هنا أيضا خوارزمية جديدة لإخفاء هذه العناصر المتكررة الحساسة أو قواعد الرابطة الحساسة من خلال إخفائها في كل موقع على حدة. ويمكن أن يتم ذلك عن طريق تعديل قاعدة البيانات الأصلية لكل موقع من أجل خفض الدعم لكل من العناصر الحساسة أو العلاقات الرابطة. النتائج التي تم الحصول عليها من تطبيق الخوارزمية المفترضة تشير إلى قدرتها على إخفاء العناصر المتكررة الحساسة بوقت تنفيذ جيد وبأقل تأثيرات جانبية. كما أن النظام المفترض استطاع الحصول على العناصر المتكررة العامة للبيانات (Global Frequent Itemset) الموزعة على عدة مواقع مع الحفاظ على خصوصية كل موقع.


Article
Hiding Sensitive Association Rules over Privacy Preserving Distributed Data Mining
التنقيب عن البيانات, شبه امينة, قواعد الإقت ا رن, قواعد البيانات الموزعة, التشفير التبادلي

Loading...
Loading...
Abstract

The problem of Privacy Preserving Data Mining (PPDM) has become more important in recent years because of the increasing ability to store personal data about users, and the increasing sophistication of data mining algorithms. A number of techniques have been suggested in recent years in order to perform PPDM. These techniques are used to study different transformation methods associated with privacy. In this paper, a system for PPDDM of association rules is proposed. This system works under the common and realistic assumptions that parties are semi-honest, Semi-Trusted Third Party (STTP) and the databases are horizontally distributed over these parties. New algorithm for hiding sensitive rules is presented in this system. The experimental results for this algorithm has shown that it have good hiding accuracy with acceptable level of side effects when it compared with the same algorithm in centralized system and other existing algorithms in distributed database system. Furthermore, the proposed system uses the Secure Socket Layer (SSL) with commutative encryption to support the certifications and security over system various components.

مشكمة حماية الخصوصية في التنقيب عن البيانات اصبحت مهمة جدا في السنوات الاخيرة وذلك بسبب زيادة القدرة عمى خزن المعموماتالشخصية لممستخدمين وكذلك بسبب زيادة التعقيدات في خوارزميات التنقيب عن البيانات. في السنوات الاخيرة تم افت ا رض عدد من التقنياتلتنفيذ عممية حماية الخصوصية في التنقيب عن البيانات, هذة التقنيات تم استخدامها لد ا رسة طرق التحويل المختمفة والمرتبطة بالخصوصية.في هذا البحث تم اقت ا رح نظام لمحفاظ عمى الخصوصية في التنقيب عن البيانات الموزعة لأستخ ا رج قواعد الأقتران ) Association Rules ) .النظام المقترح يعمل في افت ا رضات واقعية وشائعة وهي ان الاط ا رف التي تحوي عمى البيانات الموزعة تكون شبه امينه ) Semi-Honest )وشبه موثوقه ) Semi-Trusted ( وان البيانات موزعة بشكل افقي عمى جميع الاط ا رف. في هذا النظام تم اقت ا رح خوارزمية جديدة تقوم بعمميةاخفاء قواعد الأقت ا رن الحساسة. النتائج التي تم الحصول عميها من تطبيق الخوارزمية المقترحة تشير الى قدرتها عمى اخفاء قواعد الاقت ا رنالحساسة بدقة جيدة وتاثي ا رت جانبية مقبولة مقارنةً مع نفس الخوا رزمية عند تطبيقها عمى قواعد البيانات المركزية وكذلك عند مقارنتها معالخوارزميات الموجودة سابقا والمطبقة عمى قواعد البيانات الموزعه. أضافة الى ذلك فان النظام المقترح يستخدم طبقة مآخذ التوصيل ) Secure Socket Layer ( مع التشفير المتبادل ) Commutative Encryption ( لدعم المصداقية والأمنية بين جميع مكونات النظام.

Listing 1 - 2 of 2
Sort by
Narrow your search

Resource type

article (2)


Language

English (2)


Year
From To Submit

2014 (1)

2013 (1)