|
|
تولید متن فارسی بر اساس کلمات کلیدی با استفاده از مدل های احتمالاتی و یادگیری عمیق
|
|
|
|
|
نویسنده
|
پوردولت مجید ,جعفری احسان ,لنگری شادی
|
منبع
|
اولين كنفرانس ملي كسب و كار نوين در مهندسي برق و كامپيوتر - 1398 - دوره : 1 - اولین کنفرانس ملی کسب و کار نوین در مهندسی برق و کامپیوتر - کد همایش: 98191-32854 - صفحه:0 -0
|
چکیده
|
تولید زبان طبیعی (nlg) از پردازش زبان طبیعی (nlp) حاصل میشود. زبان طبیعی از یک سیستم ارائهی ماشینی مانند پایگاه دانش تولید میشود. سیستمهای nlg از مدتها پیش وجود داشته اما تکنولوژی آن به صورت ابزار تجاری اخیراً به صورت گسترده به وجود آمده است. در nlg، سیستم نیاز به تصمیمگیری در مورد چگونگی قراردادن یک مفهوم در کلمات دارد. توانایی ایجاد متن معنی دار نقش کلیدی در بسیاری از کاربردهای پردازش زبان طبیعی مانند ترجمه ماشین، گفتار و تبدیل عکس به متن دارد. برای تمامی مسائلی که از متن به متن، تصویر به متن و گفتار به متن مطرح است، تولید متن نقش کلیدی دارد. تولید متن در روش های مختلف بخصوص روش های یادگیری عمیق در سالهای اخیر مورد بررسی قرار گرفته است. با توجه به این که تولید محتوا به خصوص متن توسط دانشمندان حوزه هوش مصنوعی در حال تحقیق و بررسی است، هنوز کار خاصی بر روی زبان فارسی صورت نگرفته است. تولید محتوای مناسب در هر حوزه یک چالش بزرگ و نگران کننده است و حتی در بعضی زمینه ها تهدید و فرصت جهت پیشبرد اهداف اجتماعی، اقتصادی و سیاسی است. هدف این پایان نامه تولید متن با استفاده از روش های هوش مصنوعی در زبان فارسی با ساختار درست و آغازی برای تولید متن فارسی است. جهت پیشبرد تولید متن سعی شده است از ترکیب روش-های یادگیری ماشین و یادگیری عمیق با مدل های احتمالاتی، استفاده شود. در مدل پیشنهادی از مدل های احتمالاتی برای استخراج قوانین و از شبکه ی عصبی و شبکه های یادگیری عمیق برای برداری سازی متن استفاده شده است. نتایج بهترین مدل که از مدل یادگیری عمیق پیشآموزش دیده ی elmo استفاده می کند بیانگر این است که این روش نسبت به سایر روش ها متون پایدارتر، مفهومی تر و با ساختار بهتر تولید می کنند. مدل elmo یک مدل یادگیری عمیق با استفاده از شبکه های lstm و cnn بوده که بر اساس بافتارهای مختلف آموزش دیده و برای یک کلمه در زمینه و بافتارهای مختلف، بردارهای تعبیه مختلف ارائه میدهد. به همین دلیل مدل پیشنهادی از سایر مدلها عملکرد بهتری را دارد.
|
کلیدواژه
|
تولید متن فارسی، یادگیری ماشین، یادگیری عمیق، مدل elmo، مدلهای احتمالاتی
|
آدرس
|
, iran, , iran, , iran
|
پست الکترونیکی
|
shadilangari@gmail.com
|
|
|
|
|
|
|
|
|
|
|
|
Authors
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|