Dataset Search: موتور جستجویی با هدف کمک به محققان در یافتن دیتاست­‌های مختلف

از نوشته های من در سکان آکادمی

مهم‌ترین هدف گوگل همواره سعی در سازمان‌دهی بهتر اطلاعات موجود در وب‌سایت‌های گوناگون بوده است که در دنیای وب وجود دارند و این در حالی است که سرویس Dataset Search در کنار Google Scholar، جامعهٔ علمی را هدف اصلی خود قرار داده است به طوری که این موتور جستجو برای فعالیت‌های علمی تحقیقاتی و مطالعات دانشگاهی مورد استفاده قرار می‌گیرد. به عبارتی، گوگل این موتور جستجوی جدید را برای یافتن دیتاست طراحی کرده است که به دانشمندان کمک می‌کند داده‌ٔ مورد نیاز خود را در زمانی سریع‌تر و با صرف کمترین تلاش پیدا کنند.

Dataset Search نحوهٔ عملکردش بدین ترتیب است که از اطلاعات درج شده در متاتگ‌های وب‌سایت مؤسساتی که اطلاعات علمی خود را به صورت آنلاین منتشر می‌کنند (مثل دانشگاه‌ها یا سازمان‌های دولتی) مواردی نظیر تولیدکنندهٔ دیتا، تاریخ انتشار، روش جمع‌آوری و … را پیدا نموده و پس از ترکیب با Knowledge Graph خود آن‌ها را ایندکس‌گذاری می‌کند.

با وجود افزایش چشم‌گیر حجم داده‌ها و دیتاست‌های علمی موجود در اینترنت به واسطه مواردی نظیر درخواست ژورنال‌های علمی از نویسندگان مقالات به منظور اشتراک‌گذاری دیتاست‌های مورد استفاده و تغییر مقررات دولتی آمریکا و اروپا و جنبش عمومی دسترسی مردم به داده‌ها، یکی از مشکلات حاضر برای داده‌های علمی منتشرشده در وب پراکندگیبسیار زیاد آن‌ها است و این مورد باعث شده است تا محققان برای یافتن دیتاست‌های مورد نیاز خود، به خصوص در سایر زمینه‌های تحقیقاتی که اشراف کمتری به آن‌ها دارند، زمان زیادی را از دست بدهند (یکی از ابزارهایی که برای کار با دیتاست‌ها مورد استفاده قرار می‌گیرد Kaggle است که برای آشنایی بیشتر با آن می‌توانید به مقالهٔ Kaggle: کامیونیتی مدیریت پروژه‌های مرتبط با Data Science مراجعه نمایید.)

لینک مطلب در سکان آکادمی

You may also like

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *