خواندن دستخط قدیمی با پلتفرم هوش مصنوعی


خواندن دست خط قدیمی با پلتفرم هوش مصنوعی Transkribus

با استفاده از پلتفرم آنلاین، حتی افراد غیرمتخصص نیز می توانند نسخه های خطی تاریخی را به راحتی دیجیتالی کرده و بخوانند. اعتبار: Universität Innsbruck

با استفاده از هوش مصنوعی، رایانه ها می توانند متون دست نویس را رمزگشایی کرده و آنها را برای همه قابل خواندن کنند. پلتفرم Transkribus که در دانشگاه اینسبروک اتریش توسعه یافته است، این فناوری را در دسترس محققان و عموم مردم قرار می دهد. گروهی از مردم در حال رشد از Transkribus برای تحقیق در مورد تاریخچه خانواده خود استفاده می کنند. اخیراً کاربرانی از سراسر جهان در اینسبروک ملاقات کردند.

دست خط به اندازه افراد فردی است. با این وجود، رایانه‌های امروزی قادر به تشخیص خودکار دست‌نوشته‌ها در زبان‌های مختلف هستند. پلتفرم نرم افزار Transkribus که توسط دانشگاه اینسبروک توسعه یافته است، این فناوری را در دسترس جامعه علمی، آرشیوها و عموم مردم قرار می دهد. بیش از 90000 کاربر از سراسر جهان در حال حاضر از این پلتفرم استفاده می کنند تا اسناد دست نویس را قابل خواندن و جستجو کنند. گروهی از مردم در حال رشد به تاریخچه خانوادگی خود علاقه مند هستند و شروع به جستجوی اجداد خود در اسناد کلیسا، قراردادها یا سایر اسناد تاریخی می کنند.

گونتر مولبرگر از گروه کاری دیجیتال سازی و آرشیو دیجیتال در دانشگاه اینسبروک اتریش و رئیس هیئت مدیره می گوید: “جستجوی دستی این اسناد می تواند کاری بسیار خسته کننده باشد. فناوری ما اکنون تحقیق در مورد تاریخچه خانواده را بسیار آسان تر می کند.” از تعاونی اروپایی READ-COOP.

به سرعت مجموعه های بزرگ را جستجو کنید

آرشیوها و کتابخانه ها اسناد تاریخی با ارزش غیرقابل ارزیابی را ذخیره می کنند. این اسناد فضای زیادی را اشغال می کنند. به عنوان مثال، اسناد موجود در آرشیو دولتی اتریش 350 کیلومتر قفسه را پر می کند. بیشتر این اسناد فقط به صورت دست‌نویس در دسترس هستند و دیگر برای بسیاری از کاربران خوانا نیستند، زیرا با خطی به نام Kurrent نوشته شده‌اند، شکلی قدیمی از دستخط آلمانی زبان بر اساس خط شکسته اواخر قرون وسطی.

گونتر مولبرگر توضیح می‌دهد: «اینجاست که پلتفرم Transkribus به کار می‌آید، به‌طور خودکار این دست خط را تشخیص می‌دهد و در نتیجه آن را برای همه قابل خواندن می‌کند». علاوه بر این، اسناد نیز به راحتی قابل جستجو هستند. این امر تحقیق با استفاده از مجموعه‌های تاریخی را بسیار آسان‌تر می‌کند، زیرا صدها یا هزاران سند را می‌توان به طور همزمان برای نام‌های خانوادگی یا اصطلاحات دیگر جستجو کرد.






اعتبار: Universität Innsbruck

خواندن زبان آلمانی کورنت، عربی و چینی

Transkribus با شبکه های عصبی کار می کند. این روش یادگیری ماشینی این مزیت بزرگ را دارد که دیگر نیازی به برنامه‌نویسی دستی برای تشخیص هر نوع نوشته ندارید. گونتر مولبرگر می گوید: «کاربران به دستگاه یاد می دهند که دست خط را بخواند. “و یک ماشین خسته نمی شود، به این معنی که می تواند هزاران، صدها هزار یا میلیون ها صفحه را به طور خودکار پردازش کند. این همان کاری است که ما برای آرشیو ملی فنلاند انجام دادیم، به عنوان مثال، جایی که بیش از 2 میلیون سند دست نویس در آن وجود دارد. تا قرن 19 اکنون برای همه قابل جستجو هستند.”

فناوری مورد استفاده کاملاً مستقل از زبان و خط واقعی یا نوع نوشتار است. Transkribus نه تنها زبان آلمانی کورنت یا دستخط مدرن، بلکه خط های قرون وسطایی و همچنین دستخط عبری، عربی یا هندی را نیز می شناسد. مولبرگر می افزاید: «و در حال حاضر، ما در حال آزمایش با چینی باستان هستیم.

کمک بزرگی برای محققین

در علم و علوم انسانی نیز کاربردهای Transkribus بسیار متنوع است. به عنوان مثال، ویلیام بارتون، فیلولوژیست کلاسیک اینسبروک، که جایزه 1.2 میلیون یورویی استارت را با کمک Transkribus دریافت کرد، یادداشت‌های خاطرات کارل بندیکت هاس را از قرن نوزدهم رمزگشایی کرد که گمان می‌رفت گم شده‌اند، به صورت دست‌نویس یونانی باستان نوشت. . اطلاعات ارزشمند موجود در آن باید برای سایر زمینه های تحقیقاتی قابل دسترسی باشد.

ویلیام بارتون از دپارتمان مطالعات نئو لاتین توضیح می دهد: “روزنوشت های خصوصی و مخفی محقق کارل بندیکت هاسه حاوی سوابق 9 ساله است. حجم متن بسیار زیاد است، حدود 2500 صفحه وجود دارد.” من این دستگاه را آموزش دادم تا دستخط هاس را بر اساس 100 صفحه مدل کند. اکنون این دستگاه قادر است همه خاطرات او را بخواند و متن را به طور قابل اعتمادی رونویسی کند. مطالعه اخیر دانشگاه ادینبورگ نشان داد که اکنون بیش از 400 مقاله علمی با کمک Transkribus تولید شده است.


یادگیری ماشینی و کلان داده در حال باز کردن بایگانی اروپا هستند


اطلاعات بیشتر:
Transkribus: readcoop.eu/transkribus/

ارائه شده توسط Universität Innsbruck

نقل قول: خواندن دستخط قدیمی با پلتفرم هوش مصنوعی (2022، 11 اکتبر) بازیابی شده در 11 اکتبر 2022 از

این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.





منبع