@Article{, title={Plagiarism and Source Deception Detection Based on Syntax Analysis}, author={Eman Salih Al-Shamery and Hadeel Qasim Gheni ALkhafaji}, journal={Journal of University of Babylon مجلة جامعة بابل}, volume={25}, number={2}, pages={348-341}, year={2017}, abstract={In this research, the shingle algorithm with Jaccard method are employed as a new approach to detect deception in sources in addition to detect plagiarism . Source deception occurs as a result of taking a particular text from a source and relative it to another source, while plagiarism occurs in the documents as a result of taking part or all of the text belong to another research, this approach is based on Shingle algorithm with Jaccard coefficient , Shingling is an efficient way to compare the set of shingle in the files that contain text which are used as a feature to measure the syntactic similarity of the documents and it will work with Jaccard coefficient that measures similarity between sample sets . In this proposed system, text will be checked whether it contains syntax plagiarism or not and gives a percentage of similarity with other documents , As well as research sources will be checked to detect deception in source , by matching it with available sources from Turnitin report of the same research by using shingle algorithm with Jaccard coefficient. The motivations of this work is to discovery of literary thefts that occur on the researches , especially what students are doing in their researches , also discover the deception that occurs in the sources.

في هذا البحث, خوارزمية التسقيف وطريقة Jaccard تم استخدامهما كطريقه جديدة للكشف عن الخداع بالمصادر بالإضافة الى الكشف عن السرقة الادبية. الخداع بالمصدر يحدث نتيجة لأخذ نص معين من مصدر ونسبه الى مصدر اخر, بينما السرقة الادبية تحدث في الوثائق نتيجة لأخذ جزء أو كل من النص التابع لبحث آخر، هذه الطريقة تستند على خوارزمية التسقيف مع معامل Jaccard ، التسقيف هي طريقه فعالة لمقارنة مجاميع التسقيف في الملفات التي تحتوي على نص والتي تستخدم كميزة لقياس التشابه النحوي للوثائق والتي ستعمل مع معامل Jaccard الذي سيقيس التشابه بين المجاميع العينة . في هذا النظام المقترح ، سيتم فحص النص فيما اذا كان يحتوي على سرقة ادبية نصية أم لا، وإعطاء نسبة مئوية للتشابه مع غيرها من الوثائق، وكذلك سيتم فحص مصادر البحث لكشف الخداع بالمصدر بواسطة مطابقتها مع المصادر المتوفرة من تقرير Turnitin لنفس البحث باستخدام خوارزميه التسقيف ومعامل Jaccard. دوافع هذا العمل هو اكتشاف السرقات الادبية التي تحدث على البحوث وخصوصا ما يفعله الطلاب في بحوثهم , وكذلك اكتشاف الخداع الذي يحدث في المصادر .} }