حول المدونة
تتألف المدونة اللغوية لمتعلمي اللغة العربية من مجموعة من المواد المكتوبة والمنطوقة التي حررها متعلمو اللغة العربية في المملكة العربية السعودية
تم جمع بيانات المدونة في ٢٠١٢ و٢٠١٣، وهي تضم ١٥٨٥ نصاً (٢٨٢,٧٣٢ كلمة)، شارك في تحريرها ٩٤٢ طالباً من ٦٧ جنسية، و٦٦ لغة أم مختلفة. متوسط طول النصوص ١٧٨ كلمة.
فيما يلي بعض المعلومات حول محتوى المدونة:
تنسيق الملفات
تم إنشاء خمسة أنواع من الملفات الغير مرمزة كما يلي:
(1) ملفات نصية دون المعلومات الوصفية
(2) ملفات نصية مع المعلومات الوصفية باللغة العربية
(3) ملفات نصية مع المعلومات الوصفية باللغة الإنجليزية
(4) ملفات بلغة الترميز الممتدة (XML) مع المعلومات الوصفية باللغة العربية
(5) ملفات بلغة الترميز الممتدة (XML) مع المعلومات الوصفية باللغة الإنجليزية
من خلال المعلومات الوصفية يمكن للباحثين التعرف على خصائص النص اللغوي وكذلك من قام بتحريره، مما يضيف عمقاً أكثر لتحليل بيانات المدونة.
أصول الأوراق - المكتوبة يدوياً من قبل الطلاب - متاحة كذلك بعد أن تم إدخالها عن طريق الماسح الضوئي، وحفظها في ملفات بصيغة PDF.
كما أن التسجيلات الصوتية (٣ ساعات و٢٢ دقيقة و٥٩ ثانية) لأولئك الطلاب الذين أذنوا بنشرها على الإنترنت، متاحة للتنزيل في صيغة ملفات MP3
تم تسمية جميع ملفات المدونة بطريقة تسمح بالتعرف على الخصائص الأساسية للنص وكذلك المؤلف، نحو: S038_T2_M_Pre_NNAS_W_C
وهي بالترتيب من اليسار: رقم الطالب، رقم النص، جنس الطالب، المرحلة العامة، ناطق بالعربية باعتبارها لغته الأم أم ناطق بغيرها، نوع النص (مكتوب أم منطوق)، مكان تحرير أو تسجيل النص.