ابزار جدید مشاهده آنلاین مقالات تحقیقاتی سنگین ریاضی را آسان تر می کند


ابزار NIST مشاهده آنلاین مقالات تحقیقاتی سنگین ریاضی را آسان‌تر می‌کند

شماتیکی برای ایجاد رندر HTML SciA11y از یک پی دی اف کاغذی. با PDF دو ستونی خام در سمت چپ، S2ORC شروع کنید [24] برای استخراج عنوان، نویسندگان، چکیده، سرفصل‌های بخش، متن بدنه و منابع استفاده می‌شود. S2ORC همچنین پیوندهای بین نقل قول های درون خطی و ارجاع به شکل ها و اشیاء جدول را شناسایی می کند. دیپ فیگورها [43] برای استخراج شکل ها و جداول به همراه شرح آنها استفاده می شود. خروجی این دو مدل با ابرداده از Semantic Scholar API ادغام شده است. اکتشافی برای ساخت فهرست مطالب، درج اشکال و جداول در مکان های مناسب در متن و تعمیر URL های شکسته استفاده می شود. هدرهای HTML را همانطور که نشان داده شده اضافه می کنیم (برچسب های سرصفحه برای بخش ها، تگ های پاراگراف برای متن بدنه، و تگ های شکل برای شکل ها و جداول). اجزای برجسته (جدول مطالب و پیوندها در مراجع) در PDF و ویژگی‌های ناوبری جدید که به رندر HTML معرفی می‌کنیم، نیستند. نمونه ای از رندر HTML بخش هایی از یک سند کاغذی در سمت راست نشان داده شده است (رندر واقعی یک ستون است که در اینجا برای ارائه تقسیم شده است). اعتبار:

فرمول‌های پیچیده در مقالات فیزیک، ریاضی و مهندسی ممکن است برای برخی خواندن به طرز ترسناکی دشوار باشد، اما افراد زیادی هستند که در وهله اول صرفاً با دیدن آنها مشکل دارند. مؤسسه ملی استاندارد و فناوری (NIST) ابزاری ایجاد کرده است که این مقالات را برای افراد دارای ناتوانی بینایی آسان‌تر می‌کند و قرار است به طور عمده مورد استفاده قرار گیرد.

این ابزار که یکی از قالب‌های رایج برای نمایش فرمول‌های ریاضی را به فرمت دیگری تبدیل می‌کند، می‌تواند به دسترسی به جدیدترین و بهترین مقالات تحقیقاتی برای همه کمک کند. اکثر مقالات تحقیقاتی جدید به صورت فایل های PDF توزیع می شوند که بسیاری از افراد جامعه پژوهشی در خواندن آنها با مشکل مواجه هستند.

بر اساس گزارش سازمان بهداشت جهانی، بیش از یک چهارم جمعیت جهان دچار اختلال بینایی تشخیص داده شده هستند و مرکز نارساخوانی و خلاقیت ییل گزارش می دهد که در ایالات متحده 20 درصد از مردم به نارساخوانی مبتلا هستند. در یک مطالعه اخیر از بین مقالات علمی توزیع شده به صورت PDF، محققان دریافتند که تنها 2.4 درصد از اسنادی که نمونه برداری کردند، معیارهای دسترسی آنها را برآورده کردند.

بروس میلر از NIST، فیزیکدانی که در نرم افزار ریاضی تخصص دارد، می گوید: «اگر شما کسی نیستید که در تمام زندگی خود برای انتشار مقالات ریاضی تلاش کرده اید، ممکن است تعجب کنید که چرا این یک مشکل است. فایل‌های PDF در صفحه چاپ شده عالی به نظر می‌رسند. اما اگر می‌خواهید فرمول‌های ریاضی با صدای بلند خوانده شوند یا روی صفحه‌نمایش با اندازه‌های مختلف مانند تبلت یا تلفن خوانا باشند، عدم تطابق می‌تواند دردناک باشد. نمی‌توانید به راحتی آن را تغییر دهید. PDF برای رسانه های دیگر.”

PDF ها معمولاً چگونه تولید می شوند؟ دانشمندی که یک دستنوشته کاغذی ایجاد می‌کند که از فرمول‌های زیادی استفاده می‌کند، عموماً از زبان LaTeX (تلفظ “lay-tech”) یا یکی از بستگان نزدیک آن برای ارائه فرمول‌ها استفاده می‌کند. LaTeX از دهه 1980 مورد استفاده قرار گرفته است و به دلیل حروفچینی با کیفیت بالا که ایجاد می کند بسیار مورد احترام است، اما برای تولید صفحات چاپ شده به صورت ایستا طراحی شده است.

از دهه 1990، سازندگان صفحه وب از HTML استفاده کرده اند، که امکان تنظیم ظاهر، رفتار و چیدمان متن نمایش داده شده را بسته به زمینه آن ممکن می سازد. اگر تا به حال یک صفحه وب را به اندازه دیگری کشیده اید و متن آن را به آرامی تغییر مکان داده اید تا در محدوده مستطیل جدید قرار بگیرد، ویژگی ای را مشاهده می کنید که خوانندگان دارای ناتوانی بینایی می خواهند.

HTML مدرن شامل برنامه‌های افزودنی است که نه تنها به این قابلیت اجازه می‌دهد تا «جریان مجدد» تایپ کند، بلکه اجازه می‌دهد فرمول‌های ریاضی توسط ماشین برای کسانی که خودشان نمی‌توانند متن را بخوانند، با صدای بلند خوانده شوند. این ویژگی‌ها HTML را برای ایجاد متن در دسترس ایده‌آل می‌کند، اما برای سال‌ها هیچ راه مؤثری برای تبدیل لاتک به HTML وجود نداشت. زمانی که میلر به راهی برای آوردن بیش از 1000 صفحه کتابچه راهنمای توابع ریاضی معتبر NIST به قلمرو دیجیتال نیاز داشت، این مشکل را ایجاد کرد.

او گفت: «در آن زمان، برخی از برنامه‌ها ادعا می‌کردند لاتک را به صفحات وب تبدیل می‌کردند، اما هیچ کدام به اندازه کافی خوب کار نمی‌کردند. “من فکر کردم، بیایید سعی کنیم خودمان را بسازیم.”

ابزار NIST حاصل شد LaTeXML، که یک فایل منبع LaTeX را می خواند و نمایشی از سند ایجاد می کند که می تواند به HTML تبدیل شود. LaTeXML کلید ایجاد کتابخانه دیجیتال آنلاین توابع ریاضی بود و چندین سال بعد مدیران یک منبع آنلاین بزرگ متوجه شدند که می تواند به آنها نیز کمک کند.

این منبع است arXiv (با تلفظ “آرشیو”)، مخزن مقالات علمی که هنوز در مجلات علمی منتشر نشده است. نگهداری شده توسط دانشگاه کرنل، arXiv در حال حاضر میزبان بیش از 2 میلیون مقاله است که برای مشاهده و دانلود به صورت PDF رایگان هستند. سرور به یک ایستگاه راه برجسته تبدیل شده است، جایی که نویسندگان می توانند یافته ها را پست کنند و قبل از اعلام رسمی آنها را با همتایان خود بحث کنند.

“طبق نظرسنجی arXiv در سال 2022 انجام شد، تنها 30 درصد از کاربرانی که به فناوری کمکی متکی هستند می توانند بدون کمک به تمام تحقیقات مورد نیاز خود دسترسی داشته باشند. شمسی برین، محقق ارشد در این زمینه گفت: همان نظرسنجی نشان داد که قالب‌بندی PDF بزرگترین مانع است arXiv's گزارش دسترسی و مدیر پروژه مقالات HTML.

که با تغییر خواهد کرد arXivبرین گفت که از مبدل LaTeXML استفاده می کند. سرور نسخه‌های HTML مقالات را تولید می‌کند و نسخه HTML را در کنار پیوند برای دانلود PDF قرار می‌دهد.

را arXiv به گفته جو زسکی، دستیار مدیر مرکز شمال شرقی ADA، مخزن کاغذها را به صورت چرخشی تبدیل خواهد کرد و اولین مورد را در دسامبر 2023 ارائه خواهد کرد. این تغییر نه تنها به جامعه علمی کمک می کند تا به سیاست به روز شده کاخ سفید در مورد در دسترس قرار دادن تحقیقات با بودجه فدرال به صورت رایگان پایبند باشد، بلکه اطلاعات را برای دانشمندان جوانی که با استفاده از منابع الکترونیکی بزرگ شده اند نیز قابل دسترس خواهد کرد.

زسکی گفت: “تکیه روزافزون به وب و اطلاعات الکترونیکی در آموزش و پرورش در کنار انتظارات رو به رشد دسترسی برابر برای جوانان دارای معلولیت وجود دارد.” “برداشتن اقداماتی برای دسترسی به اطلاعات مورد نیاز دانش آموزان و قابل استفاده کردن برای آنها مهم است.”

اطلاعات مجله:
arXiv


ارائه شده توسط موسسه ملی استاندارد و فناوری


نقل قول: ابزار جدید مشاهده آنلاین مقالات تحقیقاتی سنگین ریاضی را آسان‌تر می‌کند (2024، 3 ژانویه) بازیابی شده در 3 ژانویه 2024 از

این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.





منبع

بخوان  دومین ماموریت «راکت‌لب» از خاک آمریکا موفقیت آمیز بود