السبت، 1 سبتمبر، 2007

كم سنترجم...؟؟؟ أكثر من نصف مليون مدخلة!!!

اليوم خطرت على بالي عمل إحصائية بسيطة لما يفترض ترجمته بشكل أساسي إلى اللغة العربية تحت منصة البرمجيات الحرة ، طبعا اكتفيت بثلاث تطبيقات أوبن أوفيس و كيدي وجنوم :
kde4 =97753
kde4 docs =59431
openofficehelp=421954
gnome help =19651

المجموع الكلي = 598789

يا إلهي العمل ضخم جدا جدا ، اكثر من نصف مليون مدخلة ، وكل مدخلة ربما حوت أكثر من ثلاثة أسطر !!
هذا فقط في ترجمة التطبيقات ، ماذا لو تحدثنا عن تعريب التوزيعات و ترجمة المقالات في الويكيبيديا و وترجمة الاخبار بحيث تصل إلى المستخدم العربي بشكل سريع ، وكذلك ماذا عن ترجمة الكتب، كل سنة تصدر ألالاف الكتب تحتاج إلى ترجمة ...
كل هذا دار في بالي ، و قعدت أناقش وأبحث عن حل يساعدنا في تخطي هذه المشكلة ، أحد الافكار التي أود مناقشتها ، ماذا لو قمنا ببرمجة تطبيق ترجمة من الانجليزية إلى العربية !!

طبعا الفكرة جرئية بعض الشيء ولكن ليست مستحيلة، تصوروا معي ( دعونا نحلم قليلا ) يوجد هذا التطبيق بحيث أن الجميع يستطيع الحصول عليه واستخدامه في أغراضه و تطويعه حسب احتياجاته.

يأتي المترجم وعنده ألف مدخله ، يأمر برنامج Kbabel بإرسال النصوص المراد ترجمتها إلى محرك الترجمة ، ويقوم محرك الترجمة بإرسال النصوص المترجمة ، فقط يبقى عمل المترجم التأكد من سلامة وضوح الترجمة.
وكذلك ناشري الاخبار ، وكذلك مترجمي المقالات في الويكيبيديا ، وأيضا في الكتب حيث تصبح العملية فقط إيجاد النصوص الالكترونية و الحصول على الترجمة ، المترجم فقط يتأكد من وضوح وسلامة التعابير!!

بطبيعة الحال كل برنامج لا يولد جاهزا ولكن يمر بعمليات طويلة من التطوير والتحسين !!

ما رأيكم بهذا الحلم الجميل !!

هناك 3 تعليقات:

  1. مرحبا في النادي :)

    نظريا يمكن بناء تطبيق كهذا، لكن عمليا ...

    تحتاج إلى حزمة من التطبيقات لحوسبة اللغة العربية، التحليل الصرفي والنحوي للغة، بنيتها الاشتقاقية، قواعدها البلاغية وغيرها. تطبيقات كهذه تحتاج إلى دراسات أكاديمية أولا وهو ما نفتقده تماما، وحتى الدراسات القليلة الموجودة تجد أصحابها يتغالون في حقوق الملكية الفكرية وبراءات الاختراع (أسوء ما توصل إليه عقل البشر بعد القنبلة النووية في رأيي)

    عندما تتوفر لديك بنية كهذه، تستطيع التفكير في الترجمة الآلية، في تصوري (الساذج لجهلي الشديد بهذا المجال) نحتاج لنوع من اللغة المصطنعة شيء يفهمه الحاسوب، مثلا الجملة العربية "مررت بعلي أمس" تحللها وحدة تحليل النص العربي إلى مكوناتها ثم يخزنها في لغتنا المصطنعة، شيء مثل "شخص يتحدث عن نفسه، مر بشخص يدعى علي، الوقت أمس" طبعا بصورة رياضية، بعدها يأخذ البرنامج هذه الجملة ويمررها للوحدة الخاصة بتوليد النص الإنجليزي (مثلا) وطبقا للقواعد المحددة سلفا، شخص يتحدث عن نفسه تصبح "I" "مر بشخص آخر" "passed by" وعلي اسم علم فيصير "Ali" وأمس تصير "yesterday" ثم يركبها في جملة مفيدة طبقا للقواعد. بهذه الطريقة يمكن الترجمة من أي لغة إلى أخرى دون الحاجة لوضع قواعد مخصوصة للترجمة بين هاتين اللغتين تحديدا، بل كل لغة تحوسب مستقلّة عن الآخرين.

    ما بأعلى أوهام شخص ساذج،

    ردحذف
  2. مشكلة فعلا يعني عدد المقالات في ويكيبيديا النكليزية يقارب المليونين وفي العربية يقارب اربعين الف الفرق شاسع , لكن رحلت المليون ميل تبدأ بخطوة.

    الله يعينكم في مجهودكم.

    ردحذف
  3. أهلا خالد في مدونتي

    بالفعل نحن بحاجة إلى الكثير من الحزم لحوسبة اللغة العربية في عالم المصادر الحرة،،
    بدأت اقرأ حول هذا المجال قليلا حتى اجمع المعلومات .. لا انوي حاليا بعمل مترجم ولكن سأكتب حول هذا المجال بعض المقالات ...
    لحد الان هناك نظامين للترجمة أحدهما يعتمد على القواعد الصرفية و اللغوية وهو المشهور و الثاني التحليل الكمي للبيانات وهو الذي تستخدمه جوجل في نظام الترجمة الذي تستخدمه...

    أحاول تجميع هذه المعلومات في مكان لربما يستفيد منها شخص في يوم ما

    ردحذف