research centers


Search results: Found 3

Listing 1 - 3 of 3
Sort by

Article
Basic Steps to Get Data QualitY for Data Mining
خطوات اساسية لتحسين نوعية البيانات لغرض تعدين البيانات

Author: ZAKI.S. TOWFIK
Journal: Journal of College of Education مجلة كلية التربية ISSN: 18120380 Year: 2010 Issue: 6 Pages: 117-128
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Loading...
Loading...
Abstract

The Data extracted from many sources will be integrated andthen transform into suitable form. Tthese data may be includes manyerrors and noise or inconsistencies data. It is necessary to clean thedata to get quality data before the data mined from errors and noisedata. The cleaning is the first task before any data analysis' Theresultant of cleaning analysis/model can be stamped for data qualitywhich very impotent for data minig process because without dataquality the algorithms of data nining can not work well or the resultof algorithms not good.Therefor this paper deal with Basics steps to clean data thatextracted from many sources to get good quality data for data miningalso reduce processing time, storage data and reducing costs andincreasing profits, for this case an implementation for data selectedfrom clinical chemical test for yarmook hospital education to detectand remove the errors or noise and or inconsistencies data'


Article
The Role of Metadata for Effective Data Warehouse
دور الميتاداتا لمستودع البيانات الفعّال

Authors: Alaa Abdulqahar Jihad علاء عبد القهار جهاد --- Murtadha M. Hamad مرتضى محمد حمد
Journal: Journal of university of Anbar for Pure science مجلة جامعة الانبار للعلوم الصرفة ISSN: ISSN: 19918941 Year: 2012 Volume: 6 Issue: 2 Pages: 95-100
Publisher: University of Anbar جامعة الانبار

Loading...
Loading...
Abstract

Metadata efficient method for managing Data Warehouse (DW). It is also an effective tool in reducing the time or speed to answer queries. In addition, it achieved capabilities of the integration and standardization, thus lead to faster, clear and accurate decision-making in the right time. This paper provides the definition of metadata concept, and using metadata in Data Cleaning; which it identify the sources, types of fields, and choose the appropriate algorithm. In addition, useful in Decision Support System (DSS); which it improve efficiency of analysis and reduces response time of query

الميتاداتا طريقة كفوءة لإدارة مستودع البيانات (DW). وهي اداة فعالة في تخفيض الوقت وتسريع الاجابة عن الاستفسارات. بالإضافة الى ذلك، تنجز قابليات التكامل وتوحيد المقاييس، هذا يؤدي الى تسريع اتخاذ القرار الدقيق والواضح في الوقت الصحيح. يزود هذا البحث تعريف مفهوم الميتاداتا، واستعمال هذا المفهوم في تنظيف البيانات، التي تميز المصادر، وأنواع الحقول، وتختار الخوارزمية الملائمة. بالإضافة الى ذلك، فائدة الميتاداتا في نظام مساندة القرار (DSS)، والتي تحسن كفاءة التحليل وتخفض وقت الاجابة عن الاستفسار.


Article
Data Pre-processing for knowledge discovery
مرحلة قبل المعالجة لاكتشاف المعرفة

Authors: Mortadha M. Hamad مرتضى محمد حمد --- Banaz A. Qader بناز انور قادر
Journal: Tikrit Journal of Pure Science مجلة تكريت للعلوم الصرفة ISSN: 18131662 Year: 2014 Volume: 19 Issue: 5 Pages: 143-148
Publisher: Tikrit University جامعة تكريت

Loading...
Loading...
Abstract

AbstractData pre-processing stage is also known as (data preparation) stage and it is a fundamental stage for data analysisand knowledge discovery. If there is much irrelevant and redundant information or noisy and unreliable data,then knowledge discovery during analysis and mining phase will be more difficult. Therefore we consider thepre-processing stage as an important step for knowledge discovery process and has a significant impact onpredictive accuracy. Essentially, while each customer attribute may require special treatment for each algorithm,so the choices of data pre-processing (DPP) depend on the individual dataset or database used. In this paper wehave chosen and explained two different pre-processing techniques which are (consistency, reduction) dependingon our data warehouse of marketing which contains inconsistent attributes and also contains duplicated records.We have also proposed two new algorithms for reduction named (Removing Duplication Algorithm) and forconsistency named (Resolving Inconsistency Algorithm) so that achieving the best performance for their dataset. In this paper we applied and implemented our two new algorithms on our data warehouse using (C#programming language) and (Microsoft Access file), and gained cleaning data warehouse with consistentattributes and empty of duplicated records that is ready for preparing quality data as input to the algorithms ofdata mining process or any other analysis method which also influences of knowledge quality that is discoveredduring data mining process

الملخص: مرحلة قبل المعالجة للبیانات تعرف أیضاً بمرحلة (تهیئة البیانات) وهي مرحلة أساسیة لتحلیل البیانات واكتشاف المعرفة. عند وجود معلومات غیرمتعلقة بالموضوع وفائضة أو بیانات مشوشة وغیر موثوقة ، فان عملیة اكتشاف المعرفة خلال مراحل التحلیل والتنقیب سوف تكون صعبة ومعقدة.لذلك نعتبر مرحلة قبل المعالجة للبیانات خطوة مهمة لعملیة اكتشاف المعرفة وذو تأثیر مهم على دقة التنبؤ. بصورة أساسیة، بینما كل حقل خاصفي الجدول یحتاج نوع خاص من المعالجة لكل خوارزمیة، لذا فان اختیار خوارزمیة قبل المعالجة یعتمد على نوع قاعدة البیانات المستخدمة. فيهذا البحث قمنا باختیار وتوضیح تقنیتین مختلفتین من تقنیات قبل المعالجة للبیانات والتي هي (التناسق و التقلیل أو التخفیض) معتمداً علىمستودع البیانات الخاص بالتسویق والذي یحتوي على حقول غیر متناسقة وقیود متكررة. في هذا البحث قمنا أیضاً باقتراح وبناء خو ارزمیتین جدیدةإحداها للتقلیل تسمى (خوارزمیة إزالة التكرار) و الأخرى للتناسق تسمى (خوارزمیة تحلیل عدم التناسق) محققا بذلك أحسن الانجازات لمجامیعالبیانات. في هذا البحث قمنا بتطبیق وتنفیذ الخوارزمیتین المقترحتین على مستودع البیانات مستخدماً (لغة البرمجة #C) و(ملف MicrosoftAccess) وقد حصلنا على مستودع بیانات نظیفة ذو حقول منسقة وخالیة من القیود المكررة وجاهزة لتهیئة بیانات ذو جودة عالیة كإدخاللخوارزمیات عملیة تنقیب البیانات أو أي طریقة تحلیلیة والتي تؤثر على نوعیة المعرفة المكتشفة خلال عملیة تنقیب البیانات

Listing 1 - 3 of 3
Sort by
Narrow your search

Resource type

article (3)


Language

English (2)


Year
From To Submit

2014 (1)

2012 (1)

2010 (1)