پروژه eSpeak فارسی


لینکهای مرتبط

معرفی پروژه ایسپیک فارسی Persian eSpeak

معرفی پروژه ایسپیک بین المللی:

ای‌اسپیک فارسی (eSpeak) بخشی از پروژه بسیار بزرگتری به نام ای‌اسپیک است. به آدرس http://espeak.sf.net

پروژه ای‌اسپیک و زیرمجموعه‌‌های آن همچون ای‌اسپیک فارسی، پروژه‌‌های متن‌باز هستند و تحت لایسنس بین‌المللی GPL GNU Licence v3.0 فعالیت می‌کنند.

این لایسنس در سراسر دنیا از نرم‌افزار‌های متن‌باز که انتشار و استفاده از آنها کاملا رایگان است حمایت می‌کنند. دولت جمهوری اسلامی ایران نیز این مجوز را به رسمیت می شناسد. توجه داشته باشید تغییر در کد و انتشار نرم افزارهایی که تحت این مجوز منتشر می شوند تحت ضوابطی خاص است که در این مجوز بین المللی ذکر گردیده است و تخطی از مفاد آن پیگرد قانونی را برای نقض کنندگان در پی خواهد داشت. از این رو ترجمۀ فارسی غیر رسمی آن را در سایت خود قرار داده ایم، تا کاربران از محدودۀ حقوق خود مطلع باشند، و نقض کنندگان حقوق این پروژه ها آگاه شوند که قانون از پروژه های متن باز حمایت کرده و ما با هر گونه نقض این مجوز بشدت برخورد می کنیم. برای مطالعۀ ترجمه فارسی اینجا را کلیک کنید.

پروژه بین‌المللی ای‌اسپیک یک موتور صوتی (synthesizer) آزاد است که بسیاری از نرم‌افزارها که متن را به صدا تبدیل می‌کنند از آن بهره می‌گیرند.
زبان‌های مختلف دنیا به تدریج توسط افراد علاقمند و برنامه‌نویسان داوطلب به آن اضافه گردیده و توسط کاربران آن زبان‌ها بهبود و گسترش یافته‌اند، بطوری که ای‌اسپیک امروزه بسیاری از این زبان‌ها را بدون مشکل و بخوبی تلفظ می‌کند.
در حال حاضر ای‌اسپیک توانایی خواندن ده‌ها زبان زنده دنیا از جمله زبان فارسی را دارد.

همانگونه که ذکر شد: پروژۀ eSpeak یک پروژۀ بین المللی است، که تمامی زبانهای تحت حمایت آن در سایت رسمی آن به آدرس http://espeak.sf.net در دسترس است. این پروژه توسط "Jonathan Duddington" در سال 1995 در آغاز برای زبان انگلیسی بریتانیایی اجرا شد. و تا امروز "Jonathan Duddington"خود سرپرستی این پروژه را بر عهده دارد. لازم است متذکر شویم، که تمامی نسخه های eSpeak فارسی نیز زیر نظر آقای دادینگتون مدیر پروژه و توسط سایت بین المللی ایسپیک به همراه دیگر زبانها و کد منبع منتشر می شود.

نکته ای که پروژۀ eSpeak را تا ایناندازه موفق ساخته است این است که آقای "Jonathan Duddington" در هنگام طراحی اولیۀ eSpeak به این موضوع که eSpeak بتواند چنان انعتاف پذیر باشد که بتوان زبانهای دیگر را به آن افزود توجه داشته است. با موفقیتی که پروژۀ eSpeak در سراسر جهان بدست آورد توانست به TTS رسمی انتشارهای سیستم عامل لینوکس تبدیل شود و در پروژۀ NVDA نیز eSpeak به عنوان "Voice Synthesizer" یا همان موتور صوتی اصلی عمل می کند و متون را به صدا تبدیل می کند.

پروژۀ eSpeak تا امروز توانسته است ده ها زبان دنیا را از چینی در آسیا تا آفریکانس در قارۀ آفریقا، پشتیبانی کند.این امر با تلاش صدها برنامه نویس خلاق و علاقمند در سراسر دنیا که بدون هیچ دست مزدی و بدون آنکه نامشان را بدانید یا بشناسیدشان حاصل شده است. تا انحصار شرکتهای بزرگ را که نرم افزارهای TTS را با قیمتهای گزاف به فروش می رسانند بشکنند.

معرفی بخش زبان فارسی پروژه ایسپیک )ایسپیک فارسی Persian eSpeak (:

بخش زبان فارسی پروژه ایسپیک با نام ایسپیک فارسی (Persian eSpeak) شناخته می شود، پروژۀ eSpeak فارسی به نشانی http://www.espeak.ir توسط "شادیار خدایاری" در سال 2011 با هدف نگارش یک TTS )نوشته خوان( فارسی رایگان و Open-Source )با کد منبع باز( برای سیستم عامل لینوکس و بعدها برای ویندوز، و اندروید آغاز شد.
با تولید اولین نسخه های آزمایشی آن، "احسان اسماعیلی" نیز به پروژۀ eSpeak فارسی پیوست و با همکاری این دو نفر اولین نسخۀ پایدار آن در سال 2012 برای استفادۀ عموم منتشر گردید. از آن زمان داوطلبان زیادی در توسعۀ پروژۀ eSpeak فارسی همکاری داشته و دارند. که از همۀ آنها سپاس گذاریم بدونه تلاشهای تک تک این افراد پروژۀ eSpeak فارسی نمی توانست تا این اندازه پیشرفت کند.

ایسپیک فارسی از آن زمان تا کنون توسط شادیار خدایاری ، احسان اسماعیلی در حال پیشرفت و به‌روزرسانی است.
تمامِ حقوقِ قانونی بستۀ نرم افزاری ایسپیک فارسی از سال ۲۰11 میلادی متعلق به شادیار خدایاری و احسان اسمائلی می باشد.

چرا ایسپیک؟

ای‌اسپیک برنامه‌ای سبک و سریع است که کار با آن راحت و لذتبخش است، و در بسیاری از سیستم‌‌های عامل از جمله لینوکس، ویندوز، مکینتاش، اندروید، یونیکس بخوبی کار می‌کند. به دلیل انتشار نسخه‌‌های بروز ای‌اسپیک، این برنامه همیشه با آخرین نسخه‌‌های سیستم‌های عامل و نرم‌افزار‌های مشهور هماهنگ است. همچنین با بسیاری از نرم‌افزار‌های صفحه‌خوان (Screen Reader) سازگار است و بر روی آنها به خوبی کار می‌کند.

از آنجایی که استفاده از نرم‌افزار‌های متن‌باز کاملا رایگان است، انتشار اینگونه نرم‌افزارها هیچگونه نفع مالی‌ای را برای سازندگان خود به همراه نخواهد داشت، طبیعتا سازندگان آنها تنها می‌توانند هزینه و وقت محدودی را صرف تولید این نرم‌افزارها کنند. در بسیاری از موارد همچون پروژه ای‌اسپیک فارسی حجم داده‌هایی که باید به برنامه افزود و تحلیل و وارد کرد چنان بودجه و وقتی را طلب می‌کند که باید تعداد زیادی کارمند تمام‌وقت در اختیار داشت تا بتوانند از عهده چنین کاری برآیند. اما پروژه‌‌های متن‌باز این فرصت را برای تمام افراد علاقمند و برنامه‌نویسان داوطلب فراهم می‌کند تا به نرم‌افزاری که معتقدند مفید و قابل اعتماد خواهد بود کمک کنند. افراد علاقمند تحت نظر مدیران پروژه می‌توانند هر یک تنها بخش کوچکی را که از دستشان بر می‌آید انجام دهند تا کیفیت و قابلیت‌های نرم‌افزار افزایش پیدا کند. در این روش هر چند حجم کاری که هر یک از کاربران انجام می‌دهند بسیار کم است اما به دلیل تعداد زیاد کاربران حجم زیادی از کار در مدت کوتاهی انجام خواهد شد.

ساختار برنامۀ eSpeak :

eSpeak یک سیستم خبره مبتنی بر قاعده است. این برنامه در زبان C++ و بر اساس منطق فازی نگاشته شده است.
eSpeak دارای دو واحد اصلی مجزا واحد تحلیل زبان و واحد تولید صدا. و یک واحد جنبی واحد ترجمه می باشد.

  • واحد تحلیل زبان: eSpeak در همۀ زبانها هر واژه را بطور مجزا تحلیل می کند. این برنامه بر اساس توالی حروف بکار رفته در یک واژه و مقایسۀ آنها با الگوهای زبانشناسی گویش معیار، که بشکل الگوریتمهای پردازش زبان و قواعد استثنا به ماشین داده شده اند، الگوهای مناسب را انتخاب می کند.
    در مرحلۀ بعد بر اساس امتیازی که هر الگو بدست می آورَد، ماشین تصمیم می گیرد که کدام الگوها برای مشخص کردن تلفظ واژه مورد نظر مناسب است، و بر اساس آنها تلفظ را می سازد.
    این واحد رشتۀ ایجاد شده را بشکل کاراکترهای آوایی بر اساس استاندارد bynery IPA به واحد تولید صدا ارسال می کند.
    زبان فارسی علاوه بر چالش های معمول هر زبان برای نگارش چنین برنامه هایی مشکل خاصی دارد که نگارش برنامه ای با چنین الگوریتمی را به چالش می کشانَد.
    در زبان فارسی مصوتهای کوتاه در نگارش واژگان نوشته نمی شوند و این ماشین است که باید حدس بزند اعراب واژه در حال بررسی چه بوده است.
    البته این موضوع برای کسانی که به این زبان تکلم میکنند نیز ایجاد اشکال مینماید زیرا اگر خود ما هم با یک واژۀ فارسی برای اولینبار برخورد کنیم ممکن است نتوانیم درست آن را تلفظ نماییم.
    در eSpeak فارسی الگوریتمهایی اختصاصا برای تشخیس ریشه واژگان و همچنین تشخیص تمامی پیشوندها و پسوندهای ممکن، که می توانند به یک واژه اضافه شوند نگاشته شده است. بعلاوه eSpeak فارسی قادر است بابهای عربی و ریشۀ عربی کلمات را تشخیص دهد و بر اساس اطلاعات بدست آمده تصمیم بگیرد که اعراب آن واژه چه بوده است.

    علاوه بر اینها eSpeak فارسی دارای یک دیکشنری از واژگان استثنایی است که ماشین پس از تحلیلهای انجام گرفته در مشخص کردن اعراب آنها ناموفق بوده است تا بتوان میزان خطای ماشین را به حداقل کاهش داد.
  • واحد تولید صدا: همانگونه که ذکر شد، واحد تحلیل زبان تلفظ واژگان را به شکل رشته های کاراکتری براساس کاراکترهای آوایی استاندارد زبانشناسی معروف به IPA به واحد تولید صدا ارسال می کند. این واحد نوع صدا را براساس قواعد IPA شناسایی کرده و آواها را توسط یک سینتیسایزر قدرتمند و بسیار سریع مبتنی بر زبان C++ تولید می کند و با بیان سامتها و مصوتها در کنار هم واژگان را می سازد.
  • لازم به ذکر است، eSpeak واحدی را نیز برای ترجمۀ استاندارد رشته های کاراکترهای آوایی خود به استاندارد سیستمهای دیگر دارد. تا واحد تحلیل زبان eSpeak در سینتیسایزرهای دیگر قابل استفاده باشد.

در وب‌سایت ( http://www.espeak.ir آخرین نسخه فایل‌های فارسی ای‌اسپیک وجود دارد.
هدف از ایجاد این وب‌سایت علاوه بر دریافت آخرین نسخه فایل‌های فارسی، بهبود و اصلاح این نرم‌افزار توسط کاربران آن است. شما می‌توانید هنگامی که به واژه‌ای برخورد می‌کنید که ای‌اسپیک فارسی آن را اشتباه می‌خواند به این وب‌سایت مراجعه کرده، آن واژه و تلفظ درست آن را اضافه کنید. تا در انتشار بعدی فایل‌های فارسی این واژه به دیکشنری آن اضافه گردد تا تمامی کاربران از تلفظ صحیح آن واژه بهرمند شوند.

چرا ما معتقدیم ایسپیک فارسی باید رایگان بماند؟

به نظر ما استفاده از کامپیوتر حق هر شخصی است حتی اگر آن فرد کم بینا یا نابینا باشد. نباید کسی برای حق طبیعی خود که برای افراد سالم رایگان است پول بپردازد.
شما با استفاده و توصیه کردن اینگونه نرم افزارها به دوستانتان،، و همچنین معرفی و حمایت معنوی از گروه برنامه نویسی ایسپیک فارسی می توانید به این هدف کمک کنید. یا با کمک مالی به این گروه به این هدف کمک خواهید کرد.

چه کاری برای کمک به پروژه ای‌اسپیک فارسی (Persian eSpeak) می توانم انجام بدهم؟

اگر علاقمند هستید تا در بهبود و گسترش برنامه خودتان پروژه ای‌اسپیک فارسی شرکت داشته باشید، می‌توانید از چند راه به کاربران این برنامه کمک کنید.

  • شما با استفاده و توصیه کردن اینگونه نرم افزارها به دوستانتان،، و همچنین معرفی و حمایت معنوی از گروه برنامه نویسی ایسپیک فارسی می توانید به این هدف کمک کنید.
  • اگر شما به نقص خاصی در این برنامه برخورد کردید آن را با طراحان در میان بگذارید تا در نسخه های بعد برطرف گردد.
  • اگر شما به قاعده خاصی در ساختار زبان فارسی برخورد کرده‌اید که در نگارش ای‌اسپیک از دید سازنده دور مانده است، پس از مطالعه بخش معرفی الگوریتم‌های ای‌اسپیک فارسی آن را از طریق بخش «تماس با ما» با برنامه نویسان پروژه، در میان بگذارید.
  • شما می‌توانید هنگامی که به واژه‌ای برخورد می‌کنید که ای‌اسپیک فارسی آن را اشتباه می‌خواند به این وب‌سایت مراجعه کرده، آن واژه و تلفظ درست آن را اضافه کنید. تا در انتشار بعدی فایل‌های فارسی این واژه به دیکشنری آن اضافه گردد تا تمامی کاربران از تلفظ صحیح آن واژه بهرمند شوند.
  • حمایت مالی از پروژه های متنباز نیز در پیشرفت و توسعه آنها تأثیر بسزایی دارد، زیرا انجام پروژه های اینچنینی نیز همانند سایر پروژه ها، در پاره ای موارد نیازمند صرف حضینه است. پس خواهش مندیم لطف خود را از ما دریق نفرمایید و پروژۀ eSpeak فارسی را حمایت مالی کنید. برای انجام حمایت مالی به بخش حمایتهای مالی از سایت http://www.espeak.ir مراجعه فرمایید. ما برای حمایت و اعتماد شما نسبت به خودمان قائل به ارزش فراوان هستیم و علاوه بر تلاش در جهت پیشبرد اهداف تأیین شده، خود را موظف به شفاف سازی در امور مالی میدانیم.
    بدین منظور، حمایتهای مالی انجام شده و مصارف آنها، بطور کامل و لحظه ای در سایت منعکس میگردد و برای تمامی مراجعین قابل مشاهده میباشد.
    امید است با فعالیتهای مفید و سازندۀ خود، به حمایت شما پاسخی شایسته دهیم.
همچنین از شما خوانندگان گرامی خواهشمندیم که از طریق بخش عضویت در خبرنامه در خبرنامۀ سایت espeak.ir عضو شوید تا از آخرین تغییرات، بروزرسانی، ترفندها،، و آموزشهای نرم افزار eSpeak فارسی برای کامپیوتر و گوشیهای موبایل Android مطلع شوید. یا یک ایمیل خالی به آدرس espeakfarsi+subscribe@googlegroups.com ارسال فرمایید، تا ترتیب عضویت شما در خبرنامه سایت گروه برنامه نویسی eSpeak فارسی داده شود.

هشدارها و مجوزها:

  • توجه! تمامِ حقوقِ قانونی eSpeak فارسی از سال ۲۰11 میلادی متعلق به شادیار خدایاری و احسان اسماعیلی می باشد.
  • سایت گروه برنامه نویسی ایسپیک فارسی به آدرس http://www.espeak.ir در حال حاظر تنها مرجعی است که برنامه نویسان و توسعه دهندگان eSpeak فارسی مطالب مربوط به این پروژه را در آن مستقیما به زبان فارسی منتشر می کنند.
  • ای‌اسپیک فارسی (Persian eSpeak) تحت مجوز جهانی GPL GNU Licence v3.0 منتشر می گردد. این لایسنس در سراسر دنیا از نرم‌افزار‌های متن‌باز که انتشار و استفاده از آنها کاملا رایگان است حمایت می‌کند. دولت جمهوری اسلامی ایران نیز این مجوز را به رسمیت می شناسد. توجه داشته باشید تغییر در کد و انتشار نرم افزارهایی که تحت این مجوز منتشر می شوند تحت ضوابطی خاص است که در این مجوز بین المللی ذکر گردیده است و تخطی از مفاد آن پیگرد قانونی را برای نقض کنندگان در پی خواهد داشت. از این رو ترجمۀ فارسی غیر رسمی آن را در سایت خود قرار داده ایم، تا کاربران از محدودۀ حقوق خود مطلع باشند، و نقض کنندگان حقوق این پروژه ها آگاه شوند که قانون از پروژه های کدِ باز حمایت کرده و ما با هر گونه نقض این مجوز بشدت برخورد می کنیم. برای مطالعۀ ترجمه فارسی اینجا را کلیک کنید.

برخی از الزامات مجوز GPL GNU Licence v3.0 عبارتند از:

  • تصاحب یا مخدوش کردن، حقوق معنوی پدید آورنده یا آورندگان یک محصول یا یک اثر بر اساس مجوز جهانی GPL GNU Licence v3.0 در سراسر دنیا، و در داخل ایران بر اساس قانون حمایت از حقوق معنوی پدیدآورندگان در قوانین جمهوری اسلامی ایران پیگرد قانونی خواهد داشت.
  • توجه! ای‌اسپیک فارسی تحت مجوز جهانی GPL GNU Licence v3.0 منتشر می گردد. لذا استفاده از آن بشرط استفاده های غیر تجاری و غیر نظامی کاملا آزاد و رایگان است.
  • بر اساس مجوز جهانی GPL GNU Licence v3.0 هر گونه تغییر در کد منبع برنامه ای که به نام ای اسپیک فارسی شناخته می شود، باید با اطلاع مالکان معنوی این پروژه انجام شود.
  • هر گونه فروش کد منبع و بهره برداری غیر مجاز از پروژه ای اسپیک فارسی یا پیاده سازی تکنیکهای قفل گذاری، رمزنگاری و حتی افزودن پسورد به کد منبع فشرده شدۀ آن نیز بر اساس مجوز جهانی GPL GNU Licence v3.0 در سراسر دنیا جرم محسوب می گردد.
  • بر اساس مجوز جهانی GPL GNU Licence v3.0 هر برنامه ای که در آن، از تمامی یا حتی بخشی از کد منبع ای‌اسپیک فارسی استفاده شده باشد نیز باید تحت مجوز جهانی "GNU GPL V3" منتشر شود و انتشار کد منبع آن برنامه اجباری می باشد. انتشار آن برنامه تحت هر لایسنس دیگری پیگرد قانونی خواهد داشت.

با تشکر، تیم توسعه دهندگان پروژۀ eSpeak فارسی شادیار خدایاری، سرپرست تیم برنامه نویسی احسان اسماعیلی، سرپرست تیم بازبینی و بازخورد نسخه های ناپایدار