فرایند کاوی

فرایند کاوی و انواع آن

فرایند:

فرایند، توالی رویه‌های متصل و وابسته به یکدیگری است که در هر مرحله، یک یا چند منبع را مصرف می‌کنند تا ورودی‌ها را به خروجی‌ها تبدیل کنند.

رویکرد فرایندی:

بکارگیری مجموعه ای از فرآیندها در درون سازمان همراه با مشخص کردن تعامل و مدیریت آن‌ها رویکرد فرآیندی نامیده می‌شود.

فرایند کاوی:

فرایندکاوی مبتنی بر داده کاوی و مدلسازی فرایندی است. کشف، نظارت و بهبود فرایندها از طریق استخراج دانش از داده‌های مربوط به وقایع ثبت شده در سیستم‌های اطلاعاتی (Log) را فرایندکاوی گویند. نقطه شروع فرایندکاوی لاگ و داده‌های رویدادها هستند.

انواع فرایند کاوی:

فرایند کاوی اکتشافی: مدل بدون هیچ اطلاعات اولیه‌ای از لاگ ساخته می‌شود. (متداول‌ترین تکنیک فرایندکاوی)

فرایند کاوی انطباقی: واقعیت‌پذیر بودن فرایندها در راستای هم‌ترازی با واقعیت بررسی شده و قوانین موجود تحلیل می‌شوند. به عبارت دیگر یک مدل فرایندی موجود با لاگ‌های مربوط به همان فرایند مقایسه می‌شوند.

فرایند کاوی بهبود: هدف بهبود یا توسعه مدل فرایندی موجود با استفاده از اطلاعات واقعی مربوط به فرایندها است که به صورت لاگ‌ها سیستمی ذخیره شده‌اند. در حالی که فرایندکاوی انطباقی به سنجش هم‌ترازی بین مدل و واقعیت می‌پردازد، این فرایندکاوی به دنبال تغییر یا توسعه مدل قبلی است.

مزایای فرایند کاوی:

  • استفاده از داده‌های معتبر و جمع آوری شده در طول زمان برای کشف فرایند
  • محدود نبودن به اکتشاف فرایند
  • راهکار حل تضاد بین آن‌چه انتظار می‌رود تا اتفاق بیفتد با آن‌چه در واقعیت رخ می‌دهد
  • بررسی فرایند از دیدگاه کنترل جریان، سازمان، زمان

مراحل یک پروژه فرایند کاوی:

مرحله صفر: شروع پروژه با برنامه‌ریزی و توجیهات و دلایل لازم برای این برنامه‌ریزی

مرحله یک: استخراج داده‌های رویدادها، مدل‌ها، اهداف و سؤالات مورد نیاز از سیستم‌ها، خبرگان محیط و مدیریت. این کار نیازمند فهم داده‌های موجود و فهم حوزه است.

مرحله دو: ساخت مدل کنترل-جریان ساخته و اتصال به لاگ با تکنیک‌های اکتشاف فرایند. مدل فرایندی کشف شده ممکن است پاسخ برخی از سؤالات را داده و سبب طراحی مجدد یا اعمال تنظیمات شود.

مرحله سه: ساخت مدل فرایندی یکپارچه و توسعه مدل کنترل-جریان با استفاده از دیگر دیدگاه‌ها(مانند زمان، تاریخ و منابع).

مرحله چهار: پشتیبانی عملیاتی. دانش استخراج شده از داده‌های تاریخی رویدادها با اطلاعات موارد در حال اجرا ترکیب می‌شوند و برای پیش‌بینی و  توصیه و مداخله در موارد ضروری بکار می‌روند.

مقدار داده مورد نیاز برای Log: استخراج همه داده های ذخیره شده برای یک دوره زمانی خاص بر اساس زمان فرایندی که قرار است بررسی شود.

اصول راهنمای فرایند کاوی:

  • داده‌های رویدادها باید به عنوان اقلام درجه یک تلقی شوند: لاگ‌ها باید از نظر قابلیت اعتماد، کامل بودن، به خوبی تعریف شده باشند و حریم شخصی و امنیت در آن‌ها به درستی شناسایی شده باشد.
  • استخراج لاگ‌ها باید بر اساس سوالات مورد نظر باشد
  • از هم‌زمانی، انتخاب و دیگر ساختارهای پایه کنترل-جریان پشتیبانی شود (زبان‌ مدلسازی مناسب)
  • رویدادها باید مرتبط با عناصر مدل باشند: این رابطه برای اجرای مجدد فرایندکاوی و شناسایی انحراف‌ها و اختلاف‌ها بین لاگ‌ها و مدل‌ها بکار می‌رود و از آن به عنوان همبستگی وقایع یاد می‌شود.
  • با مدل‌ها باید به عنوان یک انتزاع هدفمند از واقعیت رفتار شود
  • فرایندکاوی باید یک رویکرد مستمر باشد

چالش های فرایند کاوی:

۱- یافتن، ادغام کردن و تمیز کردن داده‌های رویدادها: لاگ‌ها ممکن است شامل نویز باشند یا کامل نباشند. نویز به معنای داشتن داده بیش از حد(که رفتارهای نادر را توصیف می‌کنند) است اما کامل بودن به مفهوم داشتن داده خیلی کم باز می‌گردد.

۲- مقابله با لاگ‌های پیچیده که دارای ویژگی‌های متغیر هستند: از نظر تعداد رویدادها، لاگ‌های بزرگ و لاگ‌ها خیلی کوچک مناسب نیستند.

۳- ایجاد نماینده برای الگوبرداری

۴- سر و کار داشتن با تغییر تدریجی مفهوم: یعنی فرایند در زمان انجام تحلیل در حال تغییر است.

۵- بهبود تمایل جانب‌گرایانه به نوع نمایش مورد استفاده برای فرایندکاوی یا زبان هدف برای مصورسازی مدل‌ها ۶- برقراری تعادل بین معیارهای کیفی تناسب، سادگی، دقت و عمومیت

۷- کاوش میان سازمانی: با توجه به دسترس‌پذیری لاگ‌های سازمانها از طریق فناوری‌هایی مانند محاسبات ابری

۸- تامین پشتیبانی عملیاتی: پشتیبانی از تحلیل‌های بر خط یا آنلاین

۹- ترکیب فرایندکاوی با انواع دیگر تحلیل‌ها

۱۰- بهبود قابلیت استفاده برای افراد غیر حرفه‌ای: واسط کاربری بصری دوستانه و کاربرپسند

۱۱- بهبود قابلیت فهم برای افراد غیر حرفه‌ای: نمایش نتایج در قالبی مناسب و قابل فهم نمایش

کاربرد فرایند کاوی:

  • شناسایی ریسکها و فرصتهای پنهان با شناسایی جریان واقعی فرایندها با استفاده از رویدادهای واقعی و انطباق با فرایندهای موجود
  • انجام اقدامات اصلاحی با ذخیره زمان و هزینه

منبع:

Wil M.P. van der Aalst, Process Mining: Discovery, Conformance and Enhancement of Business Processes