Différences entre les versions de « مرور »

De Semantic MediaWiki - Sandbox

Balise : Éditeur de wikicode 2017
Balise : Éditeur de wikicode 2017
Ligne 8 : Ligne 8 :
 
}}
 
}}
  
تصحیح
+
{{#arrayindex:my.array|0}}
 +
 
 
{{#ask:
 
{{#ask:
 
  [[-Has subobject::+]] [[نمایه::تصحیح]]  
 
  [[-Has subobject::+]] [[نمایه::تصحیح]]  

Version du 23 avril 2020 à 12:01

امروزه در کتابخانه‌ها و مراکز آرشیو در سراسر جهان تلاش‌های زیادی برای رقومی‌سازی در حجم بالا انجام می‌شود، در کشور نیز نهادهای متعددی از قبیل کتابخانه‌ها، انتشارات، دانشگاه‌ها و مراکز آرشیو در حوزه رقومی‌سازی متون چاپی فعال هستند. این نهادها، سالانه هزینه زیادی بابت مجموعه فرآیندهای رقومی‌سازی، تصحیح و بهبود کیفیت متون مورد نظر پرداخت می‌کنند. همچنین برخی موسسات حجم زیادی از محتوا را اسکن کرده و به دلیل هزینه بالا قادر به ماشین‏خوان کردن آن نیستند. بالا بودن این هزینه‌ها و کیفیت پایین متون نهایی ما را بر آن داشت تا با بکارگیری هوشمندانه روش‌های پردازش تصویر و تکنیک‌های متن‌کاوی، با صرف زمان بسیار اندک به متن تقریباً بدون غلط دست یابیم.



برای دستیابی به متن بی غلط از طریق بهبود سیستم‌های OCR مسیر سختی وجود دارد و هزینه اصلاح دستی خروجی OCR نیز بالا است. همچنین غلط‌یاب‌ها هم در متون با موضوعات مختلف یا متون تخصصی ضعیف عمل می‌کنند، در حالی که اگر بتوان در متون خروجی فقط خطاهای موجود در خروجی OCR را به صورت خودکار شناسایی کرد و با روش‌های دیگر اصلاح نمود، علاوه بر دستیابی به دیتای تقریباً بدون غلط، می‌توان هزینه فرآیندهای ماشین‎خوان کردن متون چاپی را نیز به مراتب کاهش داد.



https://sandbox.semantic-mediawiki.org/wiki/Attribut:بهبود کیفیت, https://sandbox.semantic-mediawiki.org/wiki/Attribut:تصحیح, https://sandbox.semantic-mediawiki.org/wiki/Attribut:رقومی سازی, https://sandbox.semantic-mediawiki.org/wiki/Attribut:پردازش تصویر

https://sandbox.semantic-mediawiki.org/wiki/Attribut:بهبود کیفیت

 پاسخ
مرور
Les cookies nous aident à fournir nos services. En utilisant nos services, vous acceptez notre utilisation de cookies.