| Home> Tag Set> Details of the Tag Set |
DESIGN OF A THEORY-NEUTRAL STANDARD TAG SET EXPOUNDING TRADITIONAL MORPHOLOGICAL FEATURES FOR ARABIC LANGUAGE PART-OF-SPEECH TAGGING |
|
Details of the morphological features Part-of-Speech Tag Set for Arabic language |
|
Detailed of the morphological features grammar
Arabic document |
|
|
| |
Position 1: Main Part-of-Speech |
أَقسام الكلام الرئيسيَّة |
|
Position |
Feature Name |
Tag |
1 |
Main Part-of-Speech |
أَقسام الكلام الرئيسيَّة |
أمثلة |
|
Noun |
اسم |
كِتَاب |
n |
Verb |
فعل |
كَتَبَ |
v |
Particle |
حرف |
عَلَى |
p |
Residual |
أخرى |
كاتِبةٌ |
r |
Punctuation |
علامة ترقيم |
قالَ: أَنا ذَاهِبٌ |
u |
|
| |
Position
2: Part-of-Speech of Noun |
أقسام الكلام الفرعية (الاسم) |
|
Position |
Feature Name |
Tag |
2 |
Part-of-Speech of Noun |
أَقسام الكلام الفرعيَّة (الاسم) |
|
Gerund |
مصدر |
ضَرْب |
g |
Gerund starts with ‘miim’ |
المصدر الميمي |
مَوعِد |
m |
Gerund of one time |
مصدر المرَّة |
نَظْرَة |
o |
Gerund of state |
مصدر الهيئة/ مصدر النوع |
جِلْسَة |
s |
Gerund of emphasize |
مصدر التوكيد |
حطّمتُ الخزانةَ تحطيماً |
e |
gerund of industry |
المصدر الصناعي |
فُروسيَّة |
i |
Pronoun |
ضمير |
هو |
p |
Demonstrative pronoun |
اسم إشارة |
هذا |
d |
Special relative pronoun |
الاسم الموصول الخاص |
الذي |
r |
Common Relative pronoun |
الاسم الموصول المشترك |
مَنْ |
c |
Interrogation pronoun |
اسم استفهام |
مَنْ |
b |
Conditional noun |
اسم شرط |
أينما |
h |
Allusive noun |
كناية |
كذا |
a |
Adverb |
ظرف |
يوم |
v |
Active participle |
اسم فاعل |
ضارِب |
u |
Increased Active participle |
مبالغة اسم الفاعل |
جَرَّاح |
w |
Passive participle |
اسم مفعول |
مَضْرُوب |
k |
Adjective |
صفه مشبهة |
طويل |
j |
Noun of place |
اسم مكان |
مَكْتَب |
l |
Noun of time |
اسم زمان |
مَطْلِع |
t |
Instrumental noun |
اسم آله |
مِنْشار |
z |
Proper noun |
اسم علم |
فاطِمَة |
n |
Noun of genus |
اسم جنس |
حِصان |
q |
Numeral noun |
اسم عدد |
ثلاثة |
+ |
Verbal noun |
اسم فعل |
هيهات |
& |
Five nouns |
الأسماء الخمسة |
أَبٌ |
f |
Relative noun |
اسم منسوب |
عِلْمِيّ |
* |
Noun of diminution |
اسم تصغير |
شُجَيْرَة |
y |
Form of exaggeration |
صيغة مبالغة |
جَبَّار |
x |
|
Noun of plural form |
اسم جمع |
قوم |
$ |
Noun of genus in plural form |
اسم جنس جمعي |
تفاح |
# |
The noun of preeminence |
اسم تفضيل |
أفضل |
@ |
Invented noun |
اسم منحوت |
بسملة |
% |
Noun of sound |
اسم صوت |
آه |
! |
|
| |
Position 3: Part-of-Speech of Verb |
أَقسام الكلام الفرعيَّة (الفعل) |
|
Position |
Feature Name |
Tag |
3 |
Part-of-Speech of Verb |
أَقسام الكلام الفرعيَّة (الفعل) |
|
Past verb |
فعل ماضٍ |
كَتَبَ |
p |
Present verb |
فعل مضارع |
يَكْتُبُ |
c |
Imperative verb |
فعل أمر |
اكْتُبْ |
i |
|
| |
Position
4: Part-of-Speech of Particles |
أَقسام الكلام الفرعيَّة (الحروف) |
|
Position |
Feature Name |
Tag |
4 |
Part-of-Speech of Particles |
أَقسام الكلام الفرعيَّة (الحروف) |
|
Letter of "Jussive"/
Apocopative letter |
حرف جزم |
لَمْ |
j |
Accusative letter |
حرف نصب |
كَيْ |
o |
Preposition |
حرف جر |
إلى |
p |
Annuler |
ناسخ |
ما |
a |
Conjunction |
حرف عطف |
و |
c |
Partial Accusative letter |
حرف النصب الفرعي |
حتى |
u |
Vocative letter |
حرف نداء |
يا |
v |
Exceptive particle |
حرف استثناء |
إلاَّ |
x |
Interrogative particle |
حرف استفهام |
هل |
i |
Particle of futurity |
حرف استقبال |
سوف |
f |
Causative particle |
حرف تعليل |
كي |
s |
Negative particle |
حرف نفي |
لَمْ |
n |
Jurative particle |
حرف قسم |
بِ |
q |
|
Answer particle |
حرف الجواب |
نعم |
w |
Apocopative answer particle |
حرف شرط جازم |
إنْ |
k |
Incitement particle |
حرف تحضيض |
هلَّا |
m |
Infinitive particle |
حرف مصدري |
أنْ |
g |
Attention particle |
حرف تنبيه |
ألا |
t |
Emphasis particle |
حرف توكيد |
إنَّ |
z |
Explanation particle |
حرف تفسير |
أي |
d |
Simile particle |
حرف تشبيه |
كأنَّ |
l |
|
| |
Position 5: Residuals |
أقسام الكلام الفرعية (أخرى) |
|
Position |
Feature Name |
Tag |
5 |
Residuals |
أقسام الكلام الفرعيَّة (أخرى ( |
|
Prefix |
زيادة في أول الكلمة |
استكتبني |
p |
Suffix |
زيادة في آخر الكلمة |
أَصدقاء |
s |
Connected pronoun |
ضمير متصل |
كِتابُهُ |
r |
tā' Marbouta |
تاء مربوطة |
كاتِبَة |
t |
Relative yā' |
ياء النسبة |
عَرَبِيّ |
y |
Tanween |
تنوين |
كِتابٌ |
k |
tā' of femininization |
تاء التأنيث |
كَتَبَتْ |
f |
Noon of protection |
نون الوقاية |
سَأَلـَنِـي |
n |
Emphasized Noon |
نون التوكيد |
يَضْرِبَنَّ |
z |
Aoristic letter |
حرف مضارعة |
يَسْأَلُ |
a |
Definite article |
أداة تعريف |
الكتاب |
d |
|
masculine sound plural letters |
حروف جمع المذكر السالم |
الكاتبون |
m |
feminine sound plural letters |
حروف جمع المؤنث السالم |
الكاتبات |
l |
dual letters |
حروف المثنى |
الكاتبان |
u |
|
| |
Position 6: Punctuation marks |
أقسام الكلام الفرعية (علامات الترقيم) |
|
Position |
Feature Name |
Tag |
6 |
Punctuation marks |
أقسام الكلام الفرعية (علامات الترقيم) |
|
Full stop |
نقطة (.) |
s |
Comma |
فاصلة (،) |
c |
Colon |
نقطتان (:) |
n |
Semi colon |
فاصلة منقوطة (؛) |
l |
Parentheses |
قوسان ( ( ) ) |
p |
Square brackets |
قوسان حاصرتان ( [ ] ) |
b |
Quotation mark |
علامة اقتباس ( " " ) |
t |
Dash |
شرطة معترضة ( - ) |
d |
Question mark |
علامة استفهام ( ؟ ) |
q |
Exclamation mark |
علامة تعجب ( ! ) |
e |
Ellipsis |
علامة حذف (...) |
i |
Follow mark |
علامة التَّابعية (=) |
f |
|
| |
Position 7: Gender |
الجنس |
|
Position |
Feature Name |
Tag |
7 |
Gender |
الجنس |
|
Masculine |
مذكر |
رجل |
m |
Real Masculine |
مذكر حقيقي |
أبٌ ، أسدٌ |
r |
Figurative Masculine |
مذكر مجازي |
بيت، مصباح |
g |
|
Feminine |
مؤنث |
امرأة |
f |
Real feminine |
مؤنث حقيقي |
أُمٌّ، لَبُؤَةٌ |
l |
Figurative feminine |
مؤنث مجازي |
دَواةٌ، شَجرةٌ |
v |
oral feminine |
مؤنث لفظي |
مُعاوية، زكرياء |
o |
moral feminine |
مؤنث معنوي |
سُعاد، مَريم |
n |
oral and moral feminine |
مؤنث لفظي ومعنوي |
لَيلى، فاطمة |
b |
|
Neuter |
مذكر أو مؤنث |
|
x |
|
| |
Position 8: Number |
العدد |
|
Position |
Feature Name |
Tag |
8 |
Number |
العدد |
|
Singular |
مفرد |
قلم، فلّاح، منارة |
s |
Dual |
مثنى |
(قلم: قلمان، قلمين)(منارة: منارتان، منارتين) |
d |
Sound plural |
جمع سالم |
(فلّاح: فلّاحون، فلّاحين) (منارة: منارات) |
p |
Broken plural |
جمع تكسير |
(قلم: أقلام) |
b |
Minor plural |
جمع قلة |
(حرف: أحرف) |
m |
Major plural |
جمع كثرة |
(حرف: حروف) |
j |
Ultimate plural |
منتهى الجموع |
(مسجد: مساجد) |
u |
Plural of plural |
جمع الجمع |
(بيت: بُيوت، بُيوتات) |
l |
|
| |
Position 9: Person |
الإسناد |
|
Position |
Feature Name |
Tag |
9 |
Person |
الإسناد |
|
First person |
المُتَكَلِّم |
f |
Second person |
المُخاطَب |
s |
Third Person |
الغَائِب |
t |
|
| |
Position 10: Morphology |
الصَّرف |
|
Position |
Feature Name |
Tag |
10 |
Morphology |
الصَّرف |
|
Declined (v) |
مُعرب |
يَغيبُ |
d |
Varied (n) |
مُعرب - منصرف |
غائبٌ |
v |
Prohibited from variation (n) |
مُعرب – ممنوع من الصرف |
عُثمانُ |
p |
Structured (v, n) |
مبني |
هؤُلاءِ، فَعَلَ، لَيْتَ |
s |
|
| |
Position 11: Case & Mood |
الحالة الإعرابية للاسم أو الفعل |
|
Position |
Feature Name |
Tag |
1 1 |
Case and Mood |
الحالة الإعرابية للاسم أو الفعل |
|
Nominative |
Indicative |
مرفوع |
يَكْتُبُ |
الكتابُ |
n |
Accusative |
Subjunctive |
منصوب |
لن يَكْتُبَ |
الكتابَ |
a |
Genitive |
-------- |
مجرور |
------- |
الكتابِ |
g |
------- |
Jussive |
مجزوم |
لَمْ يَكْتُبْ |
----- |
j |
|
| |
Position 12: Case & Mood markers |
علامة الإعراب أو البناء |
|
Position |
Feature Name |
Tag |
1 2 |
Case & mood markers |
علامة الإعراب أو البناء |
|
Dhammah |
الضمة / الضم |
قدِمَ الوزيرُ، يَصومُ أحمد |
d |
Fatħah |
الفتحة / الفتح |
أكرمَ صالحٌ الوزيرَ، لنْ نَصبِرَ على الذُّلِّ |
f |
Kasrah |
الكسرة |
خلق الله السماواتِ والأرضَ |
k |
Sukoon (Silence) |
السكون |
لَمْ أُسافرْ إلى المدينةِ |
s |
Waaw |
الواو |
إذا جاءَكَ المنافقونَ |
w |
Alif |
الألف |
التقى الفريقانِ |
a |
yaa |
الياء |
ذهَبتُ إلى أخيكَ |
y |
with “noon” |
ثبوت النون |
المرشحان يتقدمانِ الإنتخابات |
n |
deletion of “noon” |
حذف النون |
المسلمون لنْ يَصبروا على الذُّلِّ |
o |
deletion of vowel letter |
حذف حرف العلَّة |
لَمْ يخشَ صالحٌ إلا اللهَ |
v |
|
| |
Position 13: Definiteness |
المَعْرِفَة والنَّكِرَة |
|
Position |
Feature Name |
Tag |
1 3 |
Definiteness |
المَعْرِفَة والنَّكِرَة |
|
Definite |
مَعْرِفَة |
الكتاب |
d |
Indefinite |
نَكِرَة |
كتاب |
i |
|
| |
Position 14: Voice |
المَبْني لِلمَعْلُوم و المَبْني لِلمَجْهُول |
|
Position |
Feature Name |
Tag |
1 4 |
Voice |
المَبْني لِلمَعْلُوم و المَبْني لِلمَجْهُول |
|
Active voice |
مَبْنِي للمَعْلُوم |
كَتَبَ |
a |
Passive voice |
مَبْنِي للمَجْهُول |
كُتِبَ |
p |
|
| |
Position 15: Emphasize |
المُؤكَّد وغيرُ المُؤكَّد |
|
Position |
Feature Name |
Tag |
1 5 |
Emphasize |
المُؤكَّد وغيرُ المُؤكَّد |
|
Emphatic verb |
فعل مُؤكَّد |
لأكتُبَنَّ |
n |
Non-emphatic verb |
فعل غير مؤكد |
أكْتُبُ |
m |
|
| |
Position 16: Transitivity |
اللازم والمتعدي |
|
Position |
Feature Name |
Tag |
1 6 |
Transitivity |
اللازم والمتعدي |
|
Intransitive |
لازِم |
نامَ الولدُ |
i |
Transitive to one object |
مُتَعدٍّ إلى مَفعُول واحِد |
فَتَحَ الرجلُ البابَ |
o |
Transitive to two objects |
مُتَعدٍّ إلى مَفْعُولَين |
أعطاه دينارًا |
b |
Transitive to three objects |
مُتَعدٍّ إلى ثَلاثَة مَفاعِيل |
أنبأتُهُ الخبرَ صحيحًا |
t |
|
| |
Position 17: Humanness |
العاقل وغير العاقل |
|
Position |
Feature Name |
Tag |
1 7 |
Humanness |
العاقل وغير العاقل |
|
Human |
عاقِل |
قَرَأَ |
h |
Non-human |
غَيْر عَاقِل |
نَبَحَ |
n |
|
| |
Position 18: Variability & Conjugation |
التَّصريف |
|
Position |
Feature Name |
Tag |
1 8 |
Variability & Conjugation |
التَّصريف |
|
Non-derived |
غير مُتصَرِّف |
هُوَ |
n |
Inert/ Concrete noun (n) |
مُتَصَرِّف – جامِد- اسم ذات |
شَجرةٌ |
c |
Inert/ Abstract noun (n) |
مُتَصَرِّف – جامِد- اسم معنى |
ذَكاءٌ |
a |
Inert/ Inherent to the past (v) |
مُتَصَرِّف – جامِد- ملازم للماضي |
نَعِمَ |
p |
Inert/ Inherent to the conform (v) |
مُتَصَرِّف – جامِد- ملازم للمضارع |
يَهبِطُ |
c |
Inert/ Inherent to the imperative (v) |
مُتَصَرِّف – جامِد- ملازم للأمر |
هَبْ، هَلُمَّ |
i |
Derived (n, v) |
مُتَصَرِّف - مُشْتَقٌّ |
كتابٌ، مكتبةٌ، يكتبُ |
d |
|
| |
Position 19: Augmented and Unaugmented |
المجرَّد والمزيد |
|
Position |
Feature Name |
Tag |
19 |
Augmented and Unaugmented |
المُجَرَّد والمَزِيد |
|
Unaugmented |
مُجَرَّد |
كَتَبَ |
s |
Augmented by one letter |
مَزيْد بِحَرف |
كَاتَبَ |
a |
Augmented by two letters |
مَزيْد بِحَرفَيْن |
اكْتَتَبَ |
b |
Augmented by three letters |
مَزيْد بِثَلاثَةِ أحرف |
اسْتَكْتَبَ |
t |
Augmented by four letters |
مَزيْد بأربعة أحرف |
استقبال |
q |
|
| |
Position 20: Root letters |
عَدَد أحْرُف الجَذْر |
|
Position |
Feature Name |
Tag |
20 |
Root letters |
عَدَد أحْرُف الجَذْر |
|
Tri-literal |
ثلاثي |
ك ت ب |
t |
Quadr-literal |
رباعي |
د ح ر ج |
q |
Quinque-literal |
خماسي |
ز ب ر ج د |
f |
|
| |
Position 21: Verb internal structure |
بُنية الفعل |
|
Position |
Feature Name |
Tag |
21 |
Verb Internal Structure |
بُنية الفعل |
|
Sound |
صحيح |
a |
Doubled |
مضعف |
b |
Hamzated first radical |
مهموز الفاء |
c |
Hamzated first radical & doubled |
مهموز الفاء مضعَّف |
d |
Hamzated first & third radical |
مهموز الفاء ومهموز اللام |
e |
Hamzated second radical |
مهموز العين |
f |
Hamzated third radical |
مهموز اللام |
g |
Mithal with Waw |
مثال واوي |
h |
Mithal with Waw & doubled |
مثال واوي مضعف |
i |
Mithal with Waw & Hamzated second radical |
مثال واوي مهموز العين |
j |
Mithal with Waw & Hamzated third radical |
مثال واوي مهموز اللام |
k |
Mithal with yā' |
مثال يائي |
l |
Mithal with yā' & doubled verb |
مثال يائي مضعف |
m |
Mithal with yā' & Hamzated second radical |
مثال يائي مهموز العين |
n |
Hollow with Waw |
أجوف واوي |
o |
Hollow with Waw & Hamzated first radical |
أجوف واوي مهموز الفاء |
p |
Hollow with Waw & Hamzated third radical |
أجوف واوي مهموز اللام |
q |
Hollow with yā' |
أجوف يائي |
r |
Hollow with yā'& Hamzated first radical |
أجوف يائي مهموز الفاء |
s |
Hollow with yā'& Hamzated third radical |
أجوف يائي مهموز اللام |
t |
Defective with Waw |
ناقص واوي |
u |
Defective with Waw & Hamzated first radical |
ناقص واوي مهموز الفاء |
v |
Defective with Waw & Hamzated third radical |
نافص واوي مهموز العين |
w |
Defective with yā' |
ناقص يائي |
x |
Defective with yā' & Hamzated first radical |
ناقص يائي مهموز الفاء |
y |
Defective with yā' & Hamzated second radical |
ناقص يائي مهموز العين |
z |
Connected Lafif |
لفيف مقرون |
* |
Connected Lafif & Hamzated first radical |
لفيف مقرون مهموز الفاء |
$ |
Separated Lafif |
لفيف مفروق |
& |
Separated Lafif & Hamzated second radical |
لفيف مفروق مهموز العين |
@ |
|
| |
Position 22: Noun finals |
أقسام الأسم تبعاً للفظ آخره |
|
Position |
Feature Name |
Tag |
22 |
Noun finals |
أقسام الأسم تبعاً للفظ آخره |
|
Sound |
الصحيح |
جبل، نهر، درهم |
s |
Semi sound |
شبه الصحيح |
دلو، بهو |
i |
noun with curtailed ending |
المنقوص |
القاضِي |
c |
noun with shortened ending |
المقصور |
بُشْرَى |
t |
noun with extended ending |
الممدود |
سَماء |
e |
noun with deleted ending |
المحذوف الآخر |
ابن، سنة، لُغة |
d |
|
| |
|