ارائه عناصر و روششناسی یادگیری تقویتی اعتباربخشی بیمارستان بر اساس مدل مفهومی عاملبنیان | ||
| چشمانداز مدیریت صنعتی | ||
| دوره 14، شماره 1 - شماره پیاپی 53، 1403، صفحه 238-264 اصل مقاله (2.02 M) | ||
| نوع مقاله: مقاله پژوهشی | ||
| شناسه دیجیتال (DOI): 10.48308/jimp.14.1.238 | ||
| نویسندگان | ||
| جواد کشوری کامران1؛ محمد علی کرامتی* 2؛ عباس طلوعی اشلقی3؛ سیدعبدالله امین موسوی4 | ||
| 1دانشجوی دکتری مدیریت فناوری اطلاعات، دانشگاه آزاد اسلامی، واحد تهران مرکزی، تهران، ایران. | ||
| 2دانشیار، گروه مدیریت صنعتی، دانشگاه آزاد اسلامی، واحد تهران مرکزی، تهران، ایران. | ||
| 3استاد، گروه مدیریت صنعتی، دانشگاه آزاد اسلامی، واحد علوم و تحقیقات تهران، تهران، ایران. | ||
| 4استادیار، گروه مدیریت فناوری اطلاعات، دانشگاه آزاد اسلامی، واحد تهران مرکزی، تهران، ایران. | ||
| چکیده | ||
| مقدمه: هدف از انجام این مطالعه، ارائه عناصر و روششناسی مدل یادگیری تقویتی منطبق بر مدل مفهومی عاملبنیان اعتباربخشی بیمارستانی در ایران است. عناصر و روششناسی مدل یادشده، زیربنای مطالعاتی مطلوبی برای ایجاد سیستم هوشمند و چندعاملی اعتباربخشی بیمارستانی و روندهای شبیهسازی محیط در جهت ارائه رهنمودهای بهرهورانه به کارگزاران و سیاستگذاران مربوطه ایجاد خواهد کرد. این مطالعه در نظر دارد تا پاسخ مناسبی به پرسشهای اصلی پژوهش که در آن ابهامات مربوط به عناصر یادگیری تقویتی و چگونگی انتخاب روششناسی یادگیری تقویتی در یک سیستم چندعاملی از نوع سیستمهای اجتماعی ـ فنی وجود دارد، ارائه کند. روشها: بهمنظور گردآوری دادههای موردنیاز برای شناخت عناصر و شناسایی فرایندهای اعتباربخشی بیمارستانی، عاملها، محیط و تعامل بین آنها، از روش مرور سیستماتیک منابع، بررسی مستندات علمی و مصاحبههای نیمهساختیافته، از طریق خبرگان، بهصورت حضوری بهره گرفته شد. مصاحبهشوندگان از میان اعضای هیئتعلمی، مدیران بیمارستان و مسئولان بهبود کیفیت بیمارستانها انتخاب شدند. جمعبندی مصاحبهها با استفاده از روشهای مبتنی بر دادهبنیاد، رویکرد ترتیبی و سیستماتیک، صورت گرفت. منابع جمعآوری ویژگیهای فرایند یادگیری ماشین با استفاده از روش مرور سیستماتیک از مستند «راهنمای اعتباربخشی 1401» بوده است. روند انتخاب ویژگیهای یادشده از طریق انتخاب صحیح از ویژگیهای خروجی مدل که همان کنشهای عامل است، صورت گرفت. فهرست کنشهای عامل بر اساس طبقهبندی ساختار درختی از محتوای مفهومی مستند فوقالذکر بهصورت یک درخت عمومی غیردودویی استخراج شد. یافتهها: مدل یادگیری تقویتی استخراجشده درصدد یافتن زنجیرههای بهینه از کنشهای عملیاتی در شرایطی که دادههای کمی موجود است، خواهد بود. مهمترین عناصر مدل یادشده عبارتاند از: مجموعه حالات: مجموعه عوامل اعتباربخشی بیمارستانی مانند متغیرهای ورودی، متغیرهای خروجی، شاخصها، پارامترها، اعداد ثابت مربوط به سنجههای هر عامل مفهومی در مستند «راهنمای اعتباربخشی 1401»؛ مجموعه کنشها: کنشهای عاملهای هوشمند؛ در هر اپیزود یادگیری تقویتی، مسیرهایی از درخت دودویی خوشهبندی سلسلهمراتبیشده اقدامات عملیاتی قابلانجام در بیمارستان و بهازای مجموعه ویژگیهای حالت هستند؛ تابع پاداش: «کسب بالاترین امتیاز ممکن در نظام رتبهبندی بیمارستانی با انجام کمترین تعداد کنش و اقدام لازم» است؛ تابع سیاست: بر اساس فرایند یادگیری هر عامل، مبتنی بر یک شبکه عصبی عمیق DQN و الگوریتم کاهش گرادیان است؛ عاملهای عملیاتی: هدف عملیاتی هر یک از عاملهای مفهومی؛ «حداکثرکردن امتیازات اعتباربخشی سنجههای حوزه مربوط به خود با توصیه کمترین اقدامات» است. چرخه کلی مدل: در این ساختار هر کدام از عاملهای هوشمند، زیرمجموعه عاملهای مفهومی نهگانه، در محدوده خود دارای یک شبکه عصبی چندلایه است که ویژگیهای حالات مرتبط، به این شبکه عصبی وارد میشود و در خروجی، بر اساس تعریف تابع سیاست ویژه آن عامل، نگاشتی از کنشهای بهینه بر حسب شرایط و حالات فعلی عامل ایجاد خواهد شد؛ مدل شبکه عصبی: شبکه عصبی عامل هوشمند برگرفته از عامل مفهومی «مدیریت و رهبری» است که در آن مشخصات لایههای ورودی، مخفی و خروجی شبکه آمده است. نتیجهگیری: جمعبندی پیشینه پژوهشهای مرتبط، نشان داد که رویکرد طراحی مدلهای اعتباربخشی بیمارستانی میتواند به دو گروه «مدلهای مفهومی بدون بهرهگیری از عوامل هوشمند» و «مدلهای مفهومی با بهرهگیری از مفاهیم هوشمندسازی و سیستمهای عاملبنیان» تقسیم شود. بررسیها نشان داد که این مطالعات دارای نتایج موردانتظار بوده و کارایی و اثربخشی مدلها و فرایندهای پیشنهادشده توسط آنها، اعتبار لازم را داشتهاند. از نقاط ضعف این پژوهشها، این است که الگوریتمهای یادگیری تقویتی لزوماً با مدلهای عاملبنیان در آنها درآمیخته نشده است. | ||
| کلیدواژهها | ||
| یادگیری تقویتی؛ کاهش گرادیان؛ عاملهای هوشمند؛ مدل شبکه عصبی؛ اعتباربخشی بیمارستانی | ||
| عنوان مقاله [English] | ||
| Presenting the Elements and Reinforcement Learning Methodology of Hospital Accreditation Based on the Agent-Based Conceptual Model | ||
| نویسندگان [English] | ||
| Javad Keshvari Kamran1؛ Mohammadali Keramati2؛ Abbas Toloie Eshlaghy3؛ Seyed Abdollah Amin Mousavi4 | ||
| 1Ph.D. Student, Department of Information Technology Management, Central Tehran Branch, Islamic Azad University, Tehran, Iran. | ||
| 2Associate Professor, Department of Industrial Management, Central Tehran Branch, Islamic Azad University, Tehran, Iran. | ||
| 3Professor, Department of Industrial Management, Science and Research Branch, Islamic Azad University, Tehran, Iran. | ||
| 4Assistant Professor, Department of Information Technology Management, Central Tehran Branch, Islamic Azad University, Tehran, Iran. | ||
| چکیده [English] | ||
| Introduction: This study presents the elements and methodology of the reinforcement learning model according to the agent-based conceptual model of hospital accreditation in Iran. The elements and methodology of the mentioned model will create a favorable study base for creating a smart and multi-agent hospital accreditation system and environment simulation trends to provide efficient guidelines to relevant agents and policymakers. This study aims to address the main research questions concerning the uncertainties related to the reinforcement learning elements and the methodology selection in a multi-agent socio-technical system. Methods: To collect the necessary information to understand the elements and identify hospital accreditation processes, agents, the environment, and their interactions, systematic reviews of sources, scientific document reviews, and semi-structured interviews with experts were conducted. Interviewees were selected from university faculty members, hospital managers, and quality improvement officers through a targeted non-random snowball sampling method. The interviews were summarized using grounded-theory-based methods and a sequential and systematic approach. The characteristics of the machine learning process were collected using a systematic review method from the "Iran Hospital Accreditation Guide 2022". The process of selecting the features was done by correctly choosing the output features of the model, which are the actions of the agent. The list of agent actions was extracted as a general non-binary tree based on the classification of the tree structure from the conceptual content of the document. Findings: The extracted reinforcement learning model seeks to find the optimal chains of operational actions under conditions where quantitative data of the hospital are available. The most important elements of the model are: Set of States: Hospital accreditation factors such as input variables, output variables, indicators, parameters, and fixed numbers related to the metrics of each conceptual agent in the "Iran Hospital Accreditation Guide 2022". Set of Actions: Actions of intelligent agents in each reinforcement learning episode, paths from the hierarchically clustered binary tree, which are operational actions that can be performed in the hospital per set of state features. Reward Function: "Obtaining the highest possible score in the hospital ranking system by performing the least number of necessary actions." Policy Function: Based on the learning process of each agent, it relies on a DQN deep neural network and a gradient reduction algorithm. Operational Agents: The operational goal of each conceptual agent is "maximizing the accreditation points of the metrics of the relevant field by recommending the least measures." General Cycle of the Model: In this structure, each intelligent agent, a subset of the nine conceptual agents, has a multi-layered neural network. The characteristics of related states are entered into this neural network, and in the output, based on the special policy function definition of that agent, a map of optimal actions is created according to the agent's current conditions and states. Neural Network Model: The neural network of the intelligent agent is derived from the conceptual agent "management and leadership," specifying the input, hidden, and output layers of the network. Conclusion: Summarizing the background of related research showed that the approach to designing hospital accreditation models could be divided into two groups: "conceptual models without using intelligent agents" and "conceptual models using intelligence and operating systems". The investigations showed that these studies had the expected results and that the efficiency and effectiveness of the models and processes proposed by them had the necessary validity. | ||
| کلیدواژهها [English] | ||
| Reinforcement Learning, Gradient Reduction, Intelligent Agents, Neural Network Model, Hospital Accreditation | ||
| مراجع | ||
| ||
|
آمار تعداد مشاهده مقاله: 2,329 تعداد دریافت فایل اصل مقاله: 1,796 |
||
