TY - JOUR ID - TI - FIMA: A New Fuzzy Item sets Miner Algorithm خوارزمية جديدة لتعدين مجاميع العناصر المضببة AU - Hussein K. Al-Khafaji PY - 2009 VL - IS - 25 SP - 15 EP - 35 JO - Al-Rafidain University College For Sciences مجلة كلية الرافدين الجامعة للعلوم SN - 16816870 AB - Frequent itemsets mining is the second step of Association rules mining which is the main task of Knowledge Discovery (KDD) and data mining (DM). There are three types of itemsets; Crisp (CI), Generalized (GI), and Fuzzy itemsets (FI). FI is the most recent type. This paper presents a new algorithm to mine fuzzy itemsets from large taxonomic databases depending on fuzzy taxonomies that reflect partial belongings among data items, also it depends on Item-Transaction layout, and shortest path finding between an item and its super classes. The proposed algorithm, Fuzzy Itemsets Miner Algorithm (FIMA) deals with the three types of fuzzy itemsets; taxonomic nodes, linguistic terms, and hedges. FIMA scans the database, under mining, only once. It excludes the need for complicated data structures, prunes the pruning steps of available algorithm, and avoids the weakness of manipulating low levels values of minimum support threshold. The algorithm performs much better than the available algorithm such that it reduces the complexity of mining FIs from exponential, O(an), to linear order of magnitude O(n).

تعدين مجاميع العناصر الكبيرة هي المرحلة الاولى والاكثر تعقيدا من مراحل تعدين قواعد الارتباط المخبئة في قواعد البيانات والتي بدورها تعد من أهم مهام تعدين البيانات. هنالك ثلاثة أنواع منها؛ مجاميع العناصر الكبيرة الواضحة، مجاميع العناصر الكبيرة المعممة، و مجاميع العناصر الكبيرة المضببة. الأخيرة هي الأحدث في أدبيات المجال والأكثر أهمية كون المشاكل الحقيقية مضببة في الغالب. هذا البحث يقدم خوارزمية جديدة لاستخراج مجاميع العناصر الكبيرة من قواعد البيانات التصنيفية المضببة. الخوارزمية تعتمد على التصنيف المضبب، الذي يشير الى انتماء العناصر الجزئي إلى تصانيفها الفوقية، وعلى الترتيب العمودي لقواعد البيانات، وعلى الهيكل الشبكي لتمثيل البيانات. الخوارزمية تتعامل مع الأنواع الثلاثة للمجاميع المضببة: العقد التصنيفية، العبارات اللغوية، والوشيعية. الخوارزمية تتفحص قاعدة البيانات مرة واحدة فقط، لا تحتاج إلى هياكل بيانات إضافية مثل أشجار الاختزال، لا تولد مجاميع مرشحة لذا فإنها لا تحتاج إلى خطوات التشذيب الموجودة في الخوارزمية المعتمدة على خوارزمية البديهة، وتتعامل مع خطوط عتبة منخفضة القيم. إن أداء الخوارزمية يتفوق على نظيرتها الحالية حيث حولت مشكلة التعدين من مشكلة أسية إلى مشكلة خطية التعقيد. ER -