fareh icon indicating copy to clipboard operation
fareh copied to clipboard

تحسين صفحة ترحيب الخازنة أو المستودع

Open engahmadkadi opened this issue 3 years ago • 7 comments

تحية طيبة،

هل يمكن تحسين محتوى ملف Read.Me في الخازِنَة ليعطي فكرة أوضح عن الغرض من كل ملف؟

سأطرح هنا الأسئلة التي لم استطع الإجابة عليها، و التي قد تساعد في إعطاء إرشادات لذلك:

  • ما المعنيُّ من اسم المجلد data/done؟ هل انتُهيَ من العمل بهذه المِلَّفات فلا يجوز تعديلهُا؟
  • لِمَ يوجد ملفان باسم mustafa.csv؟ الأول ضمن المسار data، و الآخر ضمن data/original؟
  • إلى أيِّ مِلف لي أن أضيفَ قواعدَ جديدة؟
  • ماذا يحوي ملف to_review_rules.xml؟
  • ماذا يحوي ملف replaced_rules.xml؟
  • إلى أيِّ ملف يجوز لي أن أضيف قواعد بصيغة xml مُباشَرة؟
  • ما هي قوالب القواعد التي أنجزت سابقاَ؟ مثلاً: قاعدة منع تعدية الفعل اللازم، أو الفعل المتعدي بنفسه الذي لا يفصله حرف جر عن متعديه، الفعل المتعدي بحرف جر و ليس بنفسه، و هَلمَّ جرَّاً.
  • أي برامج يجب أن يحوي حاسوبي لأتمكن من تنفيذ الأمر make test؟ libreoffice؟ و ماذا أيضاً؟
  • أنَى لي أن أختبر جودة و جدوى القواعد التي أضفتها إلى قاعدة البيانات؟
  • كتب تصحيح الأخطاء الشائعة عديدة، و كثيرٌ منها بُنِيَ على ما سبقها من كتب، ما يُلزِم تكرارها. فهل للقاعدة الواحدة أن يُشير إليها عدة مراجع؟
  • لم يوجد ملفان من replaces.txt احدهما في المستوى الأول، و الثاني ضمن المسار data/done؟ طابَ يومُكم و دُمتم سالمين! أحمد

engahmadkadi avatar Feb 14 '22 08:02 engahmadkadi

السلام عليكم مستودع فارح للغتنا الجميلة، يهدف إلى بناء قاموس رقمي للأغلاط الشائعة، بصيغة مجرّدة، غير مرتبطة ببرنامج معين، يمكن الاستفادة منها في برامج أخرى مستقبلا، من جهة أخرى، توفر أدوات تساعد في بناء قواعد بصيغة مناسبة لبرنامج أداة اللغة LanguageTool

تحية طيبة،

هل يمكن تحسين محتوى ملف Read.Me في الخازِنَة ليعطي فكرة أوضح عن الغرض من كل ملف؟

سأعدّله حسب ما اقترحته

سأطرح هنا الأسئلة التي لم استطع الإجابة عليها، و التي قد تساعد في إعطاء إرشادات لذلك:

جيد جدا

* ما المعنيُّ من اسم المجلد data/done؟ هل انتُهيَ من العمل بهذه المِلَّفات فلا يجوز تعديلهُا؟

الملفات والقواعد المنجزة، يمكن مراجعتها لتجنب التكرار، أو لتصحيح الأخطاء

* لِمَ يوجد ملفان باسم mustafa.csv؟ الأول ضمن المسار data، و الآخر ضمن data/original؟

مجلد الأصول، فيه الملفات الخام، للحفظ، نسخة الملف الآخر في المسار data للعمل

* إلى أيِّ مِلف لي أن أضيفَ قواعدَ جديدة؟

يمكن عمل ملف مشابه لملف data/ArabicCommunErrors0.2.ods بأعمدته المختلفة، ثم تمريره في سكريبت make

* ماذا يحوي ملف to_review_rules.xml؟

هذه قواعد صياغتها لم تنجح، لذا وضعناها للمراجعة

* ماذا يحوي ملف replaced_rules.xml؟

هذه قواعد استبدلت بصياغة أخرى

* إلى أيِّ ملف يجوز لي أن أضيف قواعد بصيغة xml مُباشَرة؟

يمكن الاستعانة بأداة بناء القواعد أونلاين https://community.languagetool.org/?lang=ar حين يمكن تصفح القواعد السابقة، وبناء قواعد جديدة

* ما هي قوالب القواعد التي أنجزت سابقاَ؟ مثلاً: قاعدة منع تعدية الفعل اللازم، أو الفعل المتعدي بنفسه الذي لا يفصله حرف جر عن متعديه، الفعل المتعدي بحرف جر و ليس بنفسه، و هَلمَّ جرَّاً.

هناك أنواع من الأخطاء، بعضها نصوغه بصيغة XML، مثل الأخطاء اللغوي العامة مثل "إنشاء الله"، وبعضها بسيط يمكن وضعه في قوائم عامة، مثل ملفات نصيةن تستبدل مباشرة:

  • الكلمات العامية أو الأجنبية التي لها مقابل عربي:
  • darja.txt
  • الكلمات الملتبسة في تشكيلها:
  • diacritics.txt أمّا قواعد اللزوم والتعدي ( قاعدة منع تعدية الفعل اللازم، أو الفعل المتعدي بنفسه الذي لا يفصله حرف جر عن متعديه، الفعل المتعدي بحرف جر و ليس بنفسه) فنعمل على جعلها قاعدة عامة مزودة بقوائم للأفعال المعنية بالأخطاء، في ملفين: verb_trans_to_untrans.txt

verb_untrans_to_trans.txt

هذه القواعد نعمل على تحسينها، وإضافة الأفعال إليها

* أي برامج يجب أن يحوي حاسوبي لأتمكن من تنفيذ الأمر make test؟ libreoffice؟ و ماذا أيضاً؟

إذا عملت على تجربة القواعد، استعمل محرر القواعد أونلاين،

وإذا لديك معرفة بنظام لينكس، يمكن الاشتغال عليه بصورة أفضل، باستعمال لغة بيثون كلغة برمجة، وأمر make و libreoffice،

يمكن تعديل ملف Makefile بمنا يناسب جهازك

تحتاج ايضا إلى برنامج LanguageTool يعمل على لغة جافا،

هناك أوامر خاصة ممكن مساعدتك في تجربتها،

* أنَى لي أن أختبر جودة و جدوى القواعد التي أضفتها إلى قاعدة البيانات؟

المحرر أونلاين يوفر هذه الخدمة، هناك أوامر خاصة ممكن مساعدتك في تجربتها، تأتي مع أداة اللغة، تتطلب لغة جافا

* كتب تصحيح الأخطاء الشائعة عديدة، و كثيرٌ منها بُنِيَ على ما سبقها من كتب، ما يُلزِم تكرارها. فهل للقاعدة الواحدة أن يُشير إليها عدة مراجع؟

نعم، هذا متكرر

* لم يوجد ملفان من replaces.txt احدهما في المستوى الأول، و الثاني ضمن المسار data/done؟

لعلك تقصد ملفا آخر

  طابَ يومُكم و دُمتم سالمين!
  أحمد

شكرا لك أخي أحمد على الرسالة، سأعمل على تحسين ملف اقرأني، بشكل يسهل عملية التعديل

linuxscout avatar Feb 28 '22 10:02 linuxscout

السلام عليكم أعمل حاليا على تطوير قواعد برمجية للأفعال المتعدية:

  • المتعدي بنفسة يصحح تعدية بحرف
  • المتعدي بحرف يصحح بمتعد بنفسه
  • المتعدي بحرف يصحح بمتعد بحرف آخر

توضع الأخطاء واقتراحاتها في ملفات نصية مباشرة مخصصة لكل صنف,

العمل جار، والنتائج طيبة، *

linuxscout avatar Mar 06 '22 08:03 linuxscout

العمل جار، والنتائج طيبة، *

بارك الله بك و فيك. أتطلع لرؤية النتائج!

engahmadkadi avatar Mar 15 '22 18:03 engahmadkadi

أخي طه @linuxscout ،

  • هل أُزيلَتِ القواعد من الملف العام ArabicCommunErrors0.2.ods بعد أن صُدَّرَت إلى ملفات أخرى؟ مثل diacritices, replaces ... أم هناك تكرار في القواعد؟
  • لا أخفي ظني أنها لم تُزَل بعد، فإني لحظت وجود العمود remark في الملف. هل وسمت جميع القواعد باسم الملف الذي نُقِلَت إليه؟

هدفي من هذه الأسئلة أن نجتنب تكرار القواعد. فأما نفعه الأول، فهو جعل مكان تعديل القاعدة واحداً لا غير. و أما الثاني، فإنه يجنِّبُنا إنشاء قاعدتين لنفس الغرض، ما يقلل من عددها عند تحميلها في برنامج LanguageTools.

إن كانت الإجابة عن كلا السؤالين لا، فإنا على الأهبة لأساعد في وَسمها باسم المِلف الأخر الذي نسخت فيه. هذا يُسهل علينا، إن شئنا، حذفها ههنا، أو تجاهلها وقت تحويل هذا الملف إلى قواعد في Makefile.

و شكراً

engahmadkadi avatar Apr 13 '22 08:04 engahmadkadi

السلام عليكم أجريت عمليات كثيرة هذه الايام، ونقلت بعض الأغلاط لملفات نصية، متعلقة بقواعد برمجية بلغة جافا، مثل الأفعال المتعدية بحرف أو متعدية بنفسها، ورفعت بعض الكلمات إلى ملفات الدارجة والمتشابهات والمشكولات،

وحذفت بعضا منها من ملف القواعد.

linuxscout avatar Apr 13 '22 09:04 linuxscout

أمّا السكريبت المساعد على توليد القواعد فيحتاج حاليا إلى تحديث، وضبط من جديد، بعض القواعد التي كانت تستخرج تغيرت، وصارت أبسط بواسطة قواعد برمجية، مثل قواعد الأفعال المتعدية بحرف والمتعدية بنفسها.

linuxscout avatar Apr 13 '22 09:04 linuxscout

شكراً جزيلاً. إذا سأنتظر التعديلات في الأيام القادمة. أتمنى أن تُرفع التعديلات باستخدام إحدى الصيغ البسيطة، ليتمكن لي معرفتها. دُمتَ سالماً، أحمد

engahmadkadi avatar Apr 13 '22 10:04 engahmadkadi