>
Fa   |   Ar   |   En
   طراحی و پیاده‌سازی یک سیستم بازیابی اسناد چاپی فارسی  
   
نویسنده بهمنی زهرا
منبع مطالعات كتابداري و سازماندهي اطلاعات - 1398 - دوره : 30 - شماره : 4 - صفحه:46 -65
چکیده    هدف: معرفی، دسته‌بندی، و نقد پژوهش‌‌ها دربارۀ سیستم‌های بازشناسی و بازیابی اسناد چاپی فارسی و پیشنهاد یک سیستم بازیابی اسناد چاپی با رویکردی نو. روش‌شناسی: شیوه‌ای جدید با رویکرد جداسازی، طراحی و سپس پیاده‌سازی شده است. برای آموزش و آزمایش سیستم، پایگاه داده‌ای شامل تصویر 50 صفحه متن فارسی در 5 قلم مختلف فراهم آمد. از نیمی از این داده‌ها برای آموزش و نیمی دیگر برای آزمایش سیستم استفاده شد. یافته‌ها: سیستم‌های بازشناسی یا بازیابی سند چاپی فارسی از یکی از سه رویکرد مبتنی بر جداسازی، مبتنی بر شکل کلی کلمه، و رویکرد ترکیبی پیروی می‌کنند. این پژوهش یک سیستم مبتنی بر جداسازی پیشنهاد و پیاده‌سازی و نتایج ارائه شده است. نتیجه‌گیری: نتایج نشان می‌دهد نظام پیشنهادی، روش مناسبی برای پیاده‌سازی نظام‌های بازشناسی یا بازیابی اسناد فارسی است.
کلیدواژه بازشناسی اسناد چاپی، بازیابی اسناد چاپی، کتابخانه دیجیتالی، زیرکلمات، زیرحروف
آدرس دانشگاه صنعتی خاتم‌الانبیاء بهبهان, ایران
پست الکترونیکی zahra.bahmani2009@gmail.com
 
   A System for Printed Persian Documents  
   
Authors Bahmani Z.
Abstract    Purpose: Introducing recognition systems and retrieval systems for Farsi printed document images and categorizing conducted researches with identifying strengths and weaknesses points of each category and presenting a retrieval system for Farsi printed document images in a new way. Methodology: This paper is an applied research.An application designed and implied for Farsi printed document images retrieval. A new method in segmentation approach presented and implemented. A database including 50 Farsi documents scanned in 5 fonts provided for training and testing levels. Half of this database is used for training and other half for testing. Findings: Persian printed document image recognition and retrieval systems follow one of three approaches: based on segmentation, based on subword shape and hybrid approach. The first approachhas received less attention dueto specific challenges. In this paper a system based on segmentation proposed and implemented and the results presented. Conclusion: Results show that proposed system is anuseful method to Implement recognition systems and retrieval systems for Farsi printed document images.
Keywords
 
 

Copyright 2023
Islamic World Science Citation Center
All Rights Reserved