از سوی بنیاد ملی علم ایران اعلام شد؛

فراخوان ریزتنظیم مدل زبانی برای طراحی هوشمند نقشه یکپارچگی داده ها

به گزارش نقشه بنیاد ملی علم ایران در فراخوان جدید خود «ریزتنظیم مدل زبانی بزرگ به منظور تشخیص و طراحی هوشمند نقشه یکپارچگی داده های پراکنده فرآیندهای مدیریتی و پشتیبانی سازمانی» را بعنوان یکی دیگر از فراخوان های برنامه پشتیبانی از پژوهش عمیق شرکتهای دانش بنیان منتشر نمود.

به گزارش گروه علمی ایرنا از بنیاد ملی علم ایران، این بنیاد در جهت مأموریت گرا شدن پژوهشها و پشتیبانی از طرح های پژوهشی که به تکنولوژی روز دنیا می پردازد و می تواند باری از دوش صنعتگران کشور بردارد، فراخوان هایی را با عنوان برنامه پشتیبانی از پژوهش عمیق شرکتهای دانش بنیان منتشر نمود.
در جدید ترین فراخوان بنیاد ملی علم ایران که با مبحث «ریزتنظیم مدل زبانی بزرگ به منظور تشخیص و طراحی هوشمند نقشه یکپارچگی داده های پراکنده فرآیندهای مدیریتی و پشتیبانی سازمانی» اعلام شده است، همه افراد حائز شرایط به مدت یک ماه از تاریخ انتشار فراخوان یعنی تا ۲۶ بهمن فرصت دارند که پروپوزال خویش را از راه سامانه کایپر برای بنیاد ملی علم ایران ارسال نمایند.
این پژوهش بر توسعه یک مدل زبانی بزرگ (LLM) متمرکز است که بتواند داده های سازمانی را از منابع متنوع به صورت خودکار جمع آوری، یکپارچه سازی و تحلیل کند. مدل پیشنهادی با ترسیم نقشه ای جامع از ارتباطات داده ها، از فرایندهای مدیریتی و داده های سازمانی به شکل یکپارچه پشتیبانی می کند. خروجی پژوهش شامل یک مدل زبانی بهینه شده و سیستم خودکار پردازش داده ها خواهد بود که به بهبود بهره وری و تحقق تحول دیجیتال در سازمان ها کمک می نماید.

پیشینه مسئله پژوهش

در سالهای اخیر، سازمان ها با انفجاری از داده ها روبه رو شده اند که اغلب در سیستم های مختلف و به شکل پراکنده ذخیره شده اند. این پراکندگی داده ها چالش های مهمی را در زمینه یکپارچه سازی، تحلیل و مدیریت اطلاعات بوجود آورده است. روش های سنتی ادغام داده ها، مانند فرآیندهای ETL و ساخت APIهای سفارشی، نه تنها زمان بر و پرهزینه هستند، بلکه در رویارویی با حجم زیاد و پیچیدگی داده های مدرن هم ناکارآمد نشان داده اند.
ظهور مدلهای زبانی بزرگ (LLM) یک تحول اساسی در این حوزه بوجود آورده است. این مدلها با توانایی درک و پردازش حجم عظیمی از داده های متنی، امکان کشف الگوها و روابط پنهان در داده ها را فراهم می کنند و به ابزاری قدرتمند برای یکپارچه سازی و استخراج دانش از منابع مختلف تبدیل گشته اند. تحقیقات اخیر بر توسعه معماری های جدید ترنسفورمر، آموزش کارآمد آنها با داده های سازمانی و بهینه سازی این مدلها برای کارهای خاص تمرکز داشته اند.
این پیشنهاده پژوهش بر کاربرد مدلهای زبانی بزرگ در یکپارچه سازی داده های سازمانی، بخصوص داده های مدیریتی و پشتیبانی متمرکز است. این حوزه از داده ها اغلب کمتر مورد توجه قرار گرفته اند، در حالیکه نقش کلیدی در مدیریت و تصمیم گیری های سازمانی دارند.
هدف نهائی این پژوهش، ایجاد یک پلت فرم جامع و یکپارچه است که سازمان ها بتوانند با استفاده از آن، انواع مختلف داده های خویش را به صورت مؤثر مدیریت، یکپارچه و تحلیل کرده و در نهایت تصمیم گیری های بهتری اتخاذ کنند. این امر نه تنها به بهبود بهره وری و کارآمدی سازمان ها کمک می نماید، بلکه فرصت های جدیدی را برای نوآوری و رقابت پذیری در دنیای داده محور امروزی فراهم می آورد.

شرح مسئله پژوهش

در عصر حاضر، سازمان ها با حجم فزاینده ای از داده ها مواجهند که در منابع مختلف و سیستم های متعدد پراکنده شده اند. این داده ها که شامل اطلاعات در ارتباط با فرآیندهای مدیریتی، پشتیبانی و عملیاتی می شوند، به سبب تنوع قالب ها، ساختارها و منابع، به صورت کارآمد قابل تحلیل و بهره برداری نیستند. این امر، چالش های گوناگونی را برای سازمان ها ایجاد می کند، از جمله:
عدم دید جامع از داده ها: پراکندگی داده ها در سیستم های مختلف به عدم وجود دید یکپارچه از وضعیت سازمان منجر می شود. این امر، شناسایی الگوها، روندها و روابط پنهان در داده ها را دشوار می سازد و مانع از تصمیم گیری های آگاهانه و مبتنی بر داده می شود.
اتلاف منابع: کوشش برای یکپارچه سازی داده ها با روش های سنتی، مانند ادغام نقطه به نقطه و توسعهAPI ها، پر هزینه، زمان بر و پیچیده است. این شیوه ها، نیازمند نیروی انسانی متخصص و صرف زمان و منابع زیادی هستند و اغلب با مشکلات نگهداری و بروزرسانی مواجه می شوند.
کاهش بهره وری: عدم وجود داده های یکپارچه و در دسترس هم به کاهش بهره وری و کارآمدی سازمان منجر می شود. کارکنان، زمان زیادی را صرف جستجو و جمع آوری داده ها از منابع مختلف می کنند و در نتیجه، زمان کمتری برای انجام وظایف اصلی خود دارند.
عدم توانایی تحلیل داده ها: داده های پراکنده و ناهمگون، امکان تحلیل جامع و عمیق داده ها را از سازمان سلب می کند. سازمان ها نمی توانند با استفاده از این داده ها، بینش های ارزشمندی را برای بهبود فرآیندها، افزایش سودآوری و کاهش ریسک ها استخراج کنند.
چالش های تحول دیجیتال: تحول دیجیتال، نیازمند داده های یکپارچه و قابل دسترس است. سازمان هایی که نتوانند داده های خویش را به صورت مؤثر مدیریت و تحلیل کنند، در پیاده سازی تحول دیجیتال با مشکلات جدی مواجه خواهند شد.
محدودیت در مقیاس پذیری: روش های سنتی یکپارچه سازی داده ها، به سبب پیچیدگی و محدودیت های فنی، قابلیت مقیاس پذیری ندارند. سازمان ها با افزایش حجم و تنوع داده ها، با مشکلات جدی در یکپارچه سازی داده ها روبه رو می شوند.
با توجه به چالش های فوق، احتیاج به نگاهی نوین برای یکپارچه سازی داده های سازمانی احساس می شود. مدلهای زبانی بزرگ (LLM)، بعنوان یک فناوری نوظهور، پتانسیل بالایی برای حل این چالش ها دارند. این مدلها قادرند به صورت خودکار، نقشه ای جامع از ساختار داده ها در سازمان ایجاد و داده های سازمانی را یکپارچه سازی کنند.
مساله اصلی پژوهش
مساله اصلی این پژوهش، توسعه یک مدل زبانی بزرگ است که بتواند با دقت و کارآمدی بالایی، داده های سازمانی را از منابع مختلف جمع آوری، یکپارچه و تحلیل کند. توانایی های مورد انتظار از مدل:
یکپارچه سازی داده های سازمانی: به صورت خودکار، پایگاه های داده های سازمانی و ارتباط بین آنها را شناسایی کند.
ترسیم نقشه یکپارچگی داده ها: نقشه ای جامع از ارتباطات بین داده ها در سیستم های مختلف سازمان ایجاد نماید.
پشتیبانی از فرآیندهای مختلف: فرآیندهای مدیریتی، پشتیبانی و عملیاتی را به صورت یکپارچه پشتیبانی کند.
مقیاس پذیری: به سادگی با افزایش حجم و تنوع داده ها سازگار شود.
محدودیت های مساله
این پژوهش، بر روی داده های سطح بالای سازمانی (فرآیندهای مدیریتی) متمرکز است و داده های عملیاتی و تخصصی صنایع خرد را پوشش نمی دهد. علاوه بر این، توسعه کامل یک سیستم یکپارچه سازی داده، فراتر از محدوده این پژوهش است و این پژوهش، تمرکز اصلی خویش را بر روی توسعه مدل زبانی بزرگ و ایجاد پایپ لاین داده ها قرار می دهد.
چالش های کلیدی نیاز فناورانه
پروژه توسعه مدل زبانی بزرگ برای یکپارچه سازی داده های سازمانی با چالش های فناورانه زیر روبه رو است:
توسعه مدل زبانی مناسب: انتخاب و توسعه مدلی با دقت بالا برای داده های متنوع سازمانی، نیازمند دانش تخصصی، داده های آموزشی مناسب، ریزتنظیم دقیق و سازگاری با داده های مختلف است.
پایپ لاین داده کارآمد: ایجاد یک سیستم خودکار و مقیاس پذیر برای جمع آوری، پردازش و ذخیره سازی داده ها از منابع مختلف، چالش های مهندسی داده پیچیده ای دارد.
یکپارچه سازی با سیستم های موجود: سازگاری مدل زبانی بزرگ با سیستم های موجود، تضمین امنیت و ایجاد رابط کاربری آسان، چالش های پیاده سازی هستند.
اعتبارسنجی و کیفیت داده: اطمینان از دقت، جامعیت و به روز بودن داده ها، نیازمند روش های اعتبارسنجی قوی است.
گام های تحقیقاتی و الزامات پژوهش
فاز ۱: مطالعات پایه؛ این فاز به بررسی جامع ادبیات علمی و فنی موجود در زمینه های مدلهای زبانی و یکپارچه سازی داده ها اختصاص دارد. هدف اصلی این فاز، شناسایی دقیق نقاط قوت و ضعف روش های موجود و درک عمیق از چالش ها و فرصت های پیش رو است. نتایج این فاز بعنوان پایه و اساس برای تصمیم گیری های بعدی در طراحی و توسعه پلت فرم مورد نظر عمل خواهد نمود.
فاز ۲: تحلیل و طراحی؛ در این فاز، بعد از بررسی مطالعات پایه، نیازمندی های دقیق پروژه مشخص و اهداف قابل اندازه گیری تعریف می شوند. بر طبق این نیازمندی ها، معماری مناسب برای مدل LLM، پایپ لاین داده و سایر اجزای پلت فرم طراحی خواهد شد. این فاز شامل انتخاب تکنولوژی های مناسب، تعیین چارچوب های کلی توسعه و تعریف معیارهای موفقیت پروژه است.
فاز ۳: جمع آوری داده؛ این فاز به جمع آوری داده های مورد نیاز برای آموزش و اعتبارسنجی LLM اختصاص دارد. داده های جمع آوری شده باید شامل داده های سازمانی از منابع مختلف و با فرمت های متفاوت باشند. بعد از جمع آوری داده ها، مراحل پیش پردازش و آماده سازی داده ها برای آموزش مدل صورت می گیرد. این مراحل شامل پاک سازی داده ها، استانداردسازی فرمت ها و تبدیل داده ها به فرمت مناسب برای آموزش مدل است.
فاز ۴: توسعه مدل؛ در این فاز، یک مدل مناسب انتخاب شده و به منظور سازگاری با داده های سازمانی، مراحل ریز تنظیم و بهینه سازی بر روی آن صورت می گیرد. این فاز شامل آموزش مدل با استفاده از داده های آماده شده در فاز قبلی، تنظیم دقیق پارامترهای مدل و بهبود عملکرد مدل در اهداف خاص مورد نظر پروژه است.
فاز ۵: آزمایش و اعتبارسنجی؛ بعد از توسعه مدل، عملکرد آن در محیط شبیه سازی شده و با استفاده از معیارهای دقیق و علمی ارزیابی می شود. هدف این فاز، تعیین میزان دقت و کارآمدی مدل در کارهای مختلف و همینطور شناسایی نقاط ضعف و محدودیت های آن است. بر مبنای نتایج این فاز، مدل در صورت ضرورت مورد بازنگری و بهینه سازی بیشتر قرار خواهد گرفت.
فاز ۶: انتقال دانش؛ در این فاز، نتایج پژوهش و دانش فنی به دست آمده مستندسازی می شود. همچنین، یک برنامه آموزشی برای انتقال دانش به کاربران نهائی و تیم های پشتیبانی سازمان تدوین خواهد شد.
خروجی پژوهش
مدل زبانی بزرگ بهینه شده؛ مدل زبانی بزرگ آموزش دیده برای فهم ساختار و روابط داده های سازمانی، رابط کاربری مدل و انتقال داده از پایگاه داده همچون خروجی های این پژوهش است.
تسهیم مالکیت فکری
مالکیت معنوی؛ مجری در مالکیت معنوی ناشی از اجرای پژوهش سهیم خواهد بود و انتشار مقاله مشترک توسط مجری و متقاضی در ژورنال های داخلی و خارجی، عرضه مقاله در کنفرانس ها و سمینارها با موافقت و اشاره به نام همه دست اندرکاران مجاز خواهد بود.
مالکیت منافع مادی؛ با عنایت به مدل کسب و کار و اجرا و اثبات دستاوردهای حاصل از طرح توسط شرکت متقاضی، منافع مالی ناشی از توسعه این فناوری برای شرکت متقاضی خواهد شد اما مطابق تراضی بین شرکت متقاضی و مجری، قابل اشتراک بین آنها خواهد بود.
نحوه پذیرش
پذیرش طرح ها رقابتی است و از بین پروپوزال های دریافتی، موردی که شرایط اعلام شده در ادامه را داشته باشد، در اولویت خواهد بود. ترکیب متخصصین تیم پیشنهادی مرتبط، افراد پیشنهادشده، دارای سابقه پژوهشی و فنی در آن مبحث باشند، زمان بندی، هزینه و شرح خدمات، متناسب و در رابطه با پژوهش موردتقاضا باشد. (در این بخش، مجری می تواند برآورد اولیه خویش را اعلام نماید اما بدیهی است جزئیات اجرایی در شروع امر معلوم نیست و مجری و کارفرما با علم به این مورد وارد این توافق خواهند شد)، پروپوزال، طبق فرمت پیشنهادی بنیاد ملی علم ایران، تهیه و از راه سامانه کایپر ارسال شده باشد، فونت حروف و اعداد فارسی B Nazanin و اندازه قلم ۱۳ و فونت حروف و اعداد انگلیسی، Times New Roman و اندازه قلم ۱۱ باشد همچون این شرایط است.
هزینه های قابل قبول، حق التحقیق نیروی انسانی، تجهیزات و سخت افزار، خدمات، حوزه های اولویت دار، پژوهش در عملیات (مدیریت و ریاضی)، علوم کامپیوتر، مهندسی کامپیوتر همچون دیگر شرایط مورد نظر برای پذیرش طرح های رقابتی است.
واجدان شرایط
پژوهشگر اصلی تیم ضروری است عضو هیئت علمی فعال یکی از دانشگاه ها و مؤسسات آموزش عالی کشور باشد. تیم مورد نظر در دو حوزه هوش مصنوعی و ساختار پایگاه داده و بخصوص ساختار پایگاه داده سازمانی آشنایی داشته و در زمینه موضوعات سازمانی و مدیریتی کار کرده باشد. ازاین رو واجدان شرایط برای انجام این طرح بهتر است از میان موارد زیر باشند: ۱- پژوهش در عملیات (ریاضی و مدیریت) ۲-علوم کامپیوتر ۳- مهندسی کامپیوتر
پس از دریافت پروپوزال از راه سامانه، ارزیابی انجام گرفته و در صورت کسب امتیاز بالا، تیم برگزیده جهت مذاکره با بنیاد و شرکت متقاضی دعوت خواهد شد.
فایل های پیوست
فرم درخواست پیشنهاده (پروپوزال)
پیوست متن فراخوان
تاریخ فراخوان
افراد حائز شرایط به مدت یک ماه از تاریخ انتشار فراخوان یعنی تا ۲۶ بهمن فرصت دارند که پروپوزال خویش را از راه سامانه کایپر برای بنیاد ملی علم ایران ارسال نمایند.
پژوهش پیشنهاد شده تا سقف ۸۰ درصد، حداکثر ۲.۵ میلیارد تومان، توسط بنیاد ملی علم ایران حمایت خواهد شد. بدیهی است که مابقی هزینه ها باید توسط شرکت متقاضی عرضه دهنده پژوهش تأمین شود.
متقاضیان جهت ثبت نام می توانند به سامانه کایپر به نشانی rtms.insf.org رجوع و از راه بخش متقاضیان/ محققان اقدام نمایند. درصورتی که در این سامانه پروفایل مشخصات فردی ندارند ابتدا ثبت نام کرده و سپس به وسیله نام کاربری (Email) رمز عبور اعطا شده وارد سامانه شوند. بعد از ورود در قسمت ارسال طرح جدید می توانند از کارتابل پژوهش عمیق شرکتهای دانش بنیان مبادرت به ارسال طرح کنند.
پژوهشگران بعد از مطالعه توضیحات فراخوان و آئین نامه های مربوطه در پورتال بنیاد علم، در صورت داشتن هرگونه ابهام یا سؤال در مورد فرآیند ارسال طرح، شرایط و محتوای علمی فراخوان می توانند از پروفایل خود در سامانه کایپر با کارگروه دانش بنیان از راه تیکت، یا از راه ایمیل hatamkhani.a@insf.org سؤالات خویش را مطرح کنند یا با شماره تلفن ۰۲۱۸۲۱۶۱۳۵۰ (آقای حتم خانی) تماس بگیرند.

1403/10/28

14:14:12

5.0 از 5

تگهای خبر: آموزش , تحقیقات , تكنولوژی , خدمات

این مطلب Go Map را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط در نقشه

نظرات بینندگان نقشه در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۷ بعلاوه ۴

ارسال نظر