research centers


Search results: Found 6

Listing 1 - 6 of 6
Sort by

Article
Blackboard Agents For Standard Arabic Language Tokenization And Parsing
منظومة تعريف العين بالاعتماد على تمييز الانتشار الخلفي لشبكة عصبية

Author: Abdul Kareem Murhij Radhi عبد الكريم مرهج
Journal: Journal of Engineering and Sustainable Development مجلة الهندسة والتنمية المستدامة ISSN: 25200917 Year: 2010 Volume: 14 Issue: 4 Pages: 20-33
Publisher: Al-Mustansyriah University الجامعة المستنصرية

Loading...
Loading...
Abstract

The Processing of the Arabic language is a difficult mission comparing it with other languages. Because Sentences in Arabic language are complex, longer than the others in various languages, and have difficult structure with lattices. The syntactic structure of sentences parts may be missing, affecting the orders of words and phrases. Parsing Arabic sentences can be done via several techniques which are started with top-down and or bottom-up parsing. Recursive Transition Network one of the most famous techniques for parsing sentences. It is a finite transition automaton of limited states. This paper presents a new method in processing the first stage from Arabic language processing which is a syntax analysis by using Transition Networks techniques. This technique presents morphological analysis for sentence tokens. Prolog version 2 where used for execution parsing, since it is more consistence for natural languages representation and processing.

أن معالجة اللغةِ العربيةِ مهمّةِ صعبةِ مُقَارَنَة باللغاتِ الأخرى،لأن الجُمَل في اللغةِ العربيةِ معقدة وأطول منها في اللغاتِ المُخْتَلِفةِ، ولَها تركيبُ صعبُ متداخل ومتشابك. أن التركيب أو البنية النحوية لأجزاءِ من الجُمَلِ في اللغة العربية قَدْ يَكُون مفقودَ أو غير متكامل، والذي يُؤثّرُ ويتأثر بترتيب الكلماتِ والعباراتِ. أن إعراب الجُمَلِ العربيةِ يُمْكِنُ أَنْ يتم عن طريق عِدّة تقنيات التي تَبْدأُ من الأعلى للأسفل أَو من الأسفل للأعلى. أن الإنتقالُ التكراريُ هو أحد التقنياتِ الأكْثَر شَهْرَةِ لإعراب الجُمَلِ. وهي إنتقال آلي محدود لحالات محددة. يقدم هذا البحث أستخدام طريقة جديدة في معالجة المرحلة الأولى من معالجة اللغة العربية ألا وهي التحليل القواعدي لجمل اللغة العربية المختلفة وذلك بأستخدام تقنية شبكات التحول أو الأنتقال. تستثمر هذه الطريقة تقنية التحليل الصرفي لمفردات الجملة . أستخدمت لغة برولوك نسخة الثانية في تنفيذ عملية الأعراب لكونها اللغة الأكثر ملائمة في تمثيل و معالجة اللغات الطبيعية.

Keywords

Pos --- Morphemes --- Parsing --- Tagging --- Precision --- Recall


Article
Unification of Multiple Treebanks and Testing Them With Statistical Parser With Support of Large Corpus as a Lexical Resource

Author: Ahmed Hussein Aliwy
Journal: Engineering and Technology Journal مجلة الهندسة والتكنولوجيا ISSN: 16816900 24120758 Year: 2016 Volume: 34 Issue: 5 Part (B) Scientific Pages: 711-720
Publisher: University of Technology الجامعة التكنولوجية

Loading...
Loading...
Abstract

There are many Treebanks, texts with the parse tree, available for the researcher in the field of Natural Language Processing (NLP). All these Treebanks are limited in size, and each one used private Context Free Grammar (CFG) production rules (private formalism) because its construction is time consuming and need to experts in the field of linguistics. These Treebanks, as we know, can be used for statistical parsing and machine translation tests and other fields in NLP applications. We propose, in this paper, to build large Treebank from multiple Treebanks for the same language. Also, we propose to use an annotated corpus as a lexical resource. Three English Treebanks are taken for our study which arePenn Treebank (PTB), GENIA Treebank (GTB) and British National Corpus (BNC). Brown corpus is used as a lexical resource which contains approximately one million tokens annotated with part of speech tags for each.Our work start by the unification of POS tagsets of the three Treebank then the mapping process between Brown Corpus tagset and the unified tagset is done. This is done manually according to our experience in this field. Also, all the non-terminals in the CFG production are unified.All the three Treebanks and the Brown corpus are rebuilt according to the new modification.Our test for the proposed unification are made in three types: (i) statistical parsing test for each Treebank alone without modification, (ii) statistical parsing test for each Treebank alone after the modification, (iii) statistical parsing test for the collection of the three Treebanks after modification without support of lexical resource, and (iv) statistical parsing test for the collection of the three Treebanks after modification with support of lexical resource. The unknown words are processed using a very simple suggested method.We can show, simply in our work, that (a) the unification of multiple Treebanks can be done and will increase the accuracy. (b) A large annotated corpus as Brown corpus can be used for (i) decreasing the unknown words and (ii) we can extract the probabilities nearest to the reality. (c) The mapping between the unified tagset and the lexical tagset (used in Brown corpus) can be done straightforward.


Article
In Vitro Comparative Assessment of Facture Resistance of Roots Restored With Everstick Fiber Reinforced Composite Post

Authors: Makdad Chakmakchi --- Raghad Rasheed --- Rajaa Suliman
Journal: Journal of Oral and Dental Research مجلة طب الفم والاسنان ISSN: 23106417 Year: 2015 Volume: 2 Issue: 1 Pages: 43-50
Publisher: Iraqi Association for Oral Research الجمعية العراقية لبحوث طب الفم

Loading...
Loading...
Abstract

Aims: To evaluate and compare the fracture resistance of maxillary central incisors received EverStick adaptableglass fiber reinforced composite posts and prefabricated glass fiber Luxa post and to determine the mode of failure.Materials and Methods: Thirty extracted human permanent maxillary central incisor were decoronated, instrumented,and obturated. Post space was prepared in each root, randomly divided into 3 groups (n=10). Group (A): Control group;the roots remained without post space preparation. Group (B): The roots prepared to receive prefabricated translucentglass fiber posts (Luxa post). Group (C): The roots prepared to receive adaptable EverStick fiber reinforced compositepost. After core built up, the specimens were thermocycled, mounted in a customized metal ring and fracture resistancewas tested in a Universal Testing Machine. Data collected were analyzed statistically and the mode of failures wasanalyzed under stereomicroscope. Results: Statistical analysis revealed highly significant difference at p≤ 0.001. Group(C) showed the highest mean of fracture resistance followed by Group (B). While Group (A) the control group showthe lowest mean of fracture resistance. Fracture pattern indicated that specimens in Group: C represent 100 % favorablefailure, followed by group: B which represent 80 % favorable failure, while the control group showed 80 % unfavorablefailure. Conclusions: EverStick adaptable glass fiber reinforced composite post showed significantly more predictablefracture resistance than prefabricated glass fiber Luxa post.


Article
CONSTRUCTION OF AUTOMATED SYSTEM FOR INFORMATION EXTRACTION AND TEXT CATEGORIZATION

Author: Abdul Kareem M. Radhi
Journal: Al-Nahrain Journal of Science مجلة النهرين للعلوم ISSN: (print)26635453,(online)26635461 Year: 2008 Volume: 11 Issue: 3 Pages: 156-174
Publisher: Al-Nahrain University جامعة النهرين

Loading...
Loading...
Abstract

This paper presents a research on the field of AI via studying machine learning for natural language understanding. One important part of the process of understanding a text consists on apprehending its underlying interrelations of concepts [1]. Learning is to gain knowledge or understanding or skill in by study instruction or experience and modification of behavioral tendency by experience. We might say, very broadly that a machine learns when it changes its structure, or program, or data (based on its inputs or in response to external information) in such a manner that its expected future performance improves.The proposed system aims to extracts concepts from text written in English natural language text. In spite of the complexity of English language the proposed system offer intelligent user interactive interface that create structured query and complete the concepts relations before extracting the desired information from one or a lot of documents in specific domain in the form of templates consist a number of slots using inductive logic programming (ILP).

يتناول هذا البحث دراسة أحد حقول الذكاء الاصطناعي من خلال دراسة كيفية تعلم الماكينة لفهمها للغة الطبيعية. إن أهم جزء في عملية فهم أي نص يأتي من خلال أدراك المفاهيم الموجودة داخل ذلك النص وفهم العلاقات فيما بين تلك المفاهيم. إن التعلم هواكتساب المعرفة أو فهمها أو اكتساب المهارات من خلال دراسة الأيعازات و المهارات أو الخبرة وتغيير السلوك من خلال اكتساب تلك الخبرة. و بشكل عام يمكن القول بأن الماكينة قد تعلمت,عندمـا يتغير تركيب أو مسار البرامج متى ما تغيرت مدخلاتهــا أو من خلال الاستجابة لتغير البيانات الداخلة أليها من المصدر الخارجي وبحيث يمكن توقع تغير من كفاءتها مستقبلا". يهدف النظام المقترح إلى بناء نموذجين : الأول يسعى الى استخلاص المفاهيم من نص مكتوب باللغة الإنكليزية والثاني : يهدف الى بناء مصنف لتصنيف مجموعة من الوثائق أو النصوص.وعلى الرغم من صعوبة اللغة الطبيعية الإنكليزية


Article
Natural Language Processing Using Natural Language Toolkit
معالجة اللغات الطبيعية باستخدام معدات اللغات الطبيعية

Authors: Asmaa M. Hamandi --- Alia Karim AbdulHassan --- Hala Bahjat
Journal: Iraqi Journal of Information Technology المجلة العراقية لتكنولوجيا المعلومات ISSN: 19948638/26640600 Year: 2016 Volume: 7 Issue: 2 اللغة الانكليزية Pages: 70-83
Publisher: iraqi association of information الجمعية العراقية لتكنولوجيا المعلومات

Loading...
Loading...
Abstract

Natural Language Processing (NLP) is an application field of Artificial Intelligence (AI). It refers to all processes that applied to text such as: tokenization, stemming, lemmatizing, and other operations. In this paper, NLP applied to English text in order to find Part Of Speech POS tagging that corresponding to the English sentence by using NLTK. The first part of any machine translation system is NLP. The source language text must be processed by applying NLP tools to produce good translation. In order to simplify the most widely used NLP operations, the built _ in toolkits has been produced. They provide modules and libraries that are easy to use and apply NLP operations. Using NLTK as an NLP tool recorded accuracy ratio of 70% , with the test cases have been selected randomly. The system has been implemented on PC with WINDOWS8.1 using Python programming language.

معالجة اللغات الطبيعية هو تطبيق من تطبيقات الذكاء الصناعي، وهو يشير الى جميع عمليات المعالجة التي يمكن تطبيقها على النصوص، مثل : تجزئة النص إلى مفردات، حذف الإضافات على الكلمات، إسترجاع مصدر الكلمة وعمليات أخرى. في هذا البحث يتم إجراء عملية معالجة النص واستخراج نوع الكلمة من حيث أجزاء الكلام. يعد الجزء الأول لأي نظام ترجمة آلية هو معالجة لغات طبيعية، حيث يتم تطبيق عمليات معالجة اللغات الطبيعية على اللغة المصدر للحصول على ترجمة صحيحة. لتبسيط عمليات معالجة اللغات الطبيعية ظهرت معدات معالجة اللغات الطبيعية لضم جميع عمليات المعالجة شائعة الاستخدام بحيث تكون مبنية داخلياً. هذه المعدات تضم مكتبات ونماذج توفر سهولة استخدام وتطبيق عمليات معالجة اللغات الطبيعية. إستخدام معدات اللغات الطبيعية سجل نسبة دقة 70% لحالات اختبار تم اختيارها عشوائيا. تم تطبيق النظام باستخدام جهاز حاسوب شخصي يعمل بنظام تشغيل WINDOWS8.1 وباستخدام لغة البرمجة Python.


Article
A Hybrid Method of Linguistic and Statistical Features for Arabic Sentiment Analysis
دمج الاليات اللغوية والاحصائية لتحليل الرأي في اللغة العربية

Authors: Ahmed Sabah Ahmed AL-Jumaili احمد صباح احمد الجميلي --- Huda Kadhim Tayyeh هدى كاظم تايه
Journal: Baghdad Science Journal مجلة بغداد للعلوم ISSN: 20788665 24117986 Year: 2020 Volume: 17 Issue: 1 Supplement Pages: 385-390
Publisher: Baghdad University جامعة بغداد

Loading...
Loading...
Abstract

Sentiment analysis refers to the task of identifying polarity of positive and negative for particular text that yield an opinion. Arabic language has been expanded dramatically in the last decade especially with the emergence of social websites (e.g. Twitter, Facebook, etc.). Several studies addressed sentiment analysis for Arabic language using various techniques. The most efficient techniques according to the literature were the machine learning due to their capabilities to build a training model. Yet, there is still issues facing the Arabic sentiment analysis using machine learning techniques. Such issues are related to employing robust features that have the ability to discriminate the polarity of sentiments. This paper proposes a hybrid method of linguistic and statistical features along with classification methods for Arabic sentiment analysis. Linguistic features contains stemming and POS tagging, while statistical contains the TF-IDF. A benchmark dataset of Arabic tweets have been used in the experiments. In addition, three classifiers have been utilized including SVM, KNN and ME. Results showed that SVM has outperformed the other classifiers by obtaining an f-score of 72.15%. This indicates the usefulness of using SVM with the proposed hybrid features.

تحليل الآراء هي عملية إيجاد تصنيف إيجابي أو سلبي لنص يحتمل احتوائه على آراء. اللغة العربية واحدة من اللغات التي تضخم محتواها بشكل كبير في العقد السابق وخصوصا مع تصاعد وسائل الاتصال الاجتماعي مثل تويتر، فيسبوك وآخرين. دراسات كثيرة عاينت مهمة تحليل الآراء في اللغة العربية باستخدام تقنيات متعددة. أحد أكفأ الطرق المستخدمة في الدراسات السابقة كانت تعود لتقنيات تعلم الآلة وذلك لقدرتها على بناء قاعدة من التعلم من الحالات السابقة. مع ذلك هنالك قضايا كثيرة ممكن أن تواجه تقنيات تعلم الآلة في مهمة تحليل الرأي. واحدة من هذه القضايا هي كيفية إيجاد خصائص دقيقة في اللغة العربية التي بدورها ممكن أن تساعد على التفريق بين الآراء السلبية والإيجابية. هذه الدراسة تهدف الى اقتراح خليط من الادوات اللغوية والاحصائية في سبيل الحصول على خصائص مميزة لتحليل الرأي في اللغة العربية. الأدوات اللغوية تحتوي على تقنيات إرجاع الكلمة لأصلها وتصنيف الكلمات بالنسبة لنوعها النحوي، بينما الادوات الاحصائية تحتوي على تقنيات إيجاد أكثر الكلمات ترددا. تمت التجاربباستخدام قاعدة بيانات لآراء باللغة العربية . بالإضافة الى ذلك، تم استخدام ثلاث أنواع من تقنيات تعلم الآلة وهم (اس في ام)، (كي ان ان) و (ام اي). النتائج أظهرت بأن الـ (اس في ام) تفوقت على الطرق الأخرى باستخدام الخصائص المقترحة وذلك بحصولها على دقة تساوي 72.15 بالمئة. تشير هذه النتائج الى فائدة استخدام الـ (اس في ام) مع الخصائص المقترحة في تصنيف الآراء باللغة العربية.

Listing 1 - 6 of 6
Sort by
Narrow your search

Resource type

article (6)


Language

English (5)

Arabic and English (1)


Year
From To Submit

2020 (1)

2016 (2)

2015 (1)

2010 (1)

2008 (1)