Detection of Nunation Vowelization Types in The Quran Diacritical Marks Using Automated Text-Processing Algorithms
Amir Adel Mabrouk Eldeib
Faculty of Al-Quran and As-Sunnah || Kolej Universiti Islam Perlis (KUIPs) || Malaysia
Moulay Ibrahim El-Khalil Ghembaza
College of Computer Science and Engineering || Taibah University || Medina || KSA
Tab title
The science of diacritical marks is closely related to the Holy Quran, as it was used in the Quran to remove confusion and error from the pronunciation of the reader, so the introduction of any technique in the process of processing Quranic texts will have an effect on facilitating the tasks of researchers in the field of Quranic studies, whether on the reader of the Quran, to help him read accurate and correct recitation, or on the tutor to help him compile a number of examples appropriate for training. The importance of this research lies in employing automated text-processing algorithms to determine the locations of the Nunation vowelization types in the Holy Quran, and the possibility of their computerizing in order to facilitate the accurate recitation of the Holy Quran and, at the same time, to collect training examples in a database or building a corpus for future use in many researches and software applications for the Holy Quran and its sciences. This research aims to present a new idea through the proposition of a framework architecture that identify and discover automatically the locations and types of the Nunation in the Holy Quran based on the part-of-speech tagging algorithm for Arabic language so as to determine the type of words, and then by using a knowledge bases to discover the appropriate Nunation words and their locations, and finally discovering the type of Nunation so as to determine the vowelization of the last letter of each Nunation word according to the Quran diacritical marks science. Furthermore, another benefit is to link searching processes with Quranic texts towards extracting the composition Nunation and the sequence Nunations in the Holy Quran emerges from the science of Quran diacritical marks; and display them as data according to a set of options selected by the user through suitable applications interfaces. The basic elements that the results of searching Quranic texts should display are highlighted, in order to extract the positions and types of Nunation vowelizations. As well as, a template for the results of searching all types of Nunation in a specific Quranic Chapter is given, with several possible options to retrieve all data in detail. Keywords: Quran diacritical marks, Nunation vowelization types, text-processing algorithms, part-of-speech tagging for Arabic language, Quranic computer applications.
اكتشاف تنوين التركيب وتنوين التتابع في الضبط القرآني
باستخدام خوارزميات المعالجة النصية الآلية
أمير عادل مبروك الديب
كلية القرآن والسنة || جامعة برليس الإسلامية || ماليزيا
مُولاي إبراهيم الخليل غمبازة
كلية علوم وهندسة الحاسب الآلي || جامعة طيبة || المدينة المنورة || العربية السعودية
Tab title
علم الضبط مرتبط بالقرآن الكريم ارتباطا وثيقا، إذ أنه استُخدم واستُعمل في القرآن لرفع اللبس والخطأ عن لسان القارئ، لذلك سيكون إدخال أي تقنية في عملية معالجة النصوص القرآنية ذات أثر في تسهيل مهام الباحثين في مجال الدارسات القرآنية، هذا التسهيل سواء على قارئ القرآن لمساعدته على القراءة الصحيحة المضبوطة، أو على المعلّم لمساعدته في تجميع عدد من الأمثلة المناسبة للتدريب. تكمن أهمية هذا البحث في توظيف خوارزميات المعالجة النصية الآلية في علوم الحاسوب لاكتشاف مواضع تنوين التركيب وتنوين التتابع في القرآن الكريم، وإمكانية تطبيقها حاسوبيا؛ لتسهيل قراءة القرآن الكريم بالشكل المضبوط وفي نفس الوقت تجميع أمثلة التدريب في قاعدة بيانات أو لبناء مكنز لغوي يعد منطلقا لكثير من البحوث والبرمجيات التطبيقية الحاسوبية للقرآن الكريم وعلومه. ويهدف هذا البحث إلى تقديم فكرة جديدة من خلال اقتراح بُنية لإطار عمل لتحديد واكتشاف تلقائيا مواضع وأنواع التنوين في القرآن الكريم بالاعتماد على خوارزمية تمييز أقسام الكلام في اللغة العربية لتحديد نوع الكلمات، ثم بعد ذلك استخدام قواعد معرفة لاكتشاف الأسماء المنوّنة ومواضعها، ومن ثم اكتشاف نوع التنوين لتحديد ضبط الحرف الأخير من كل كلمة منونة حسب علم ضبط المصحف. ويتم الاستفادة كذلك من هذه الآلية المقترحة بربط عمليات البحث مع النص القرآني لاستخراج مواضع ضبط تنوين التركيب وتنوين التتابع وعرضها كبيانات حسب مجموعة عناصر أساسية وخيارات يحددها المستخدم عبر واجهات التطبيقات الخاصة بذلك. وقد تم إبراز العناصر الأساسية التي يجب أن تعرضها نتائج عمليات البحث في النص القرآني لاستخراج مواضع وأنواع ضبط التنوين، فضلا عن إعطاء نموذج لنتيجة عملية البحث عن جميع أنواع التنوين في سورة معينة حسب عدد من الخيارات الممكنة لاسترجاع كافة البيانات بالتفصيل. الكلمات المفتاحية: علم الضبط، تنوين التركيب، تنوين التتابع، خوارزميات معالجة النصوص، تمييز أقسام الكلام للغة العربية، تطبيقات حاسوبية للقرآن الكريم.