آماده سازی گزارش رویداد فرآیندکاوی

آماده‌سازی گزارش رویداد فرآیندکاوی اغلب شامل سه نوع تکنیک است: استخراج (Extraction)، همبستگی (Correlation) و انتزاع (Abstraction)  با این حال  احتمالاً این سه تکنیک اغلب از هم گسسته نیستند، شکل زیر رابطه بین این نوع تکنیک ها و مفاهیم اساسی فرآیندکاوی را نشان می دهد.

چارچوب در فرآیندکاوی

در ادامه، خلاصه ای از ابزارها و تکنیک های گزارش شده برای انتزاع، همبستگی و انتزاع داده های رویداد ارائه خواهیم کرد.

استخراج داده :

استخراج داده به به دست آوردن داده‌های رویداد از سیستم‌های منبع (اغلب پایگاه‌های اطلاعاتی زیربنای انواع سیستم‌های اطلاعاتی)  اشاره دارد. به طور کلی، داده های ذخیره شده در چنین پایگاه های داده‌ای با دیدگاه فرآیندی که در ذهن وجود دارد ثبت نمی شوند و بنابراین به طور خودکار مفاهیم اساسی مانند رویدادها و دنباله‌ها را منعکس نمی کنند. بنابراین ، شناسایی داده های رویداد مربوطه یک چالش اولیه است که اغلب به دانش قوی خبره نیاز دارد.

 هنگام بررسی راه حل ها برای استخراج داده های رویداد باید دو دیدگاه از هم جدا شوند. از یک طرف، نرم افزار تجاری فرآیندکاوی وجود دارد، که در آن فروشندگان تمرکز استراتژیک روشنی را برای رسیدگی به چالش های ناشی از استخراج گزارش رویدادها اتخاذ کرده اند. بر این اساس، اکثر ابزارهای تجاری فرآیند کاوی دارای راه‌حل‌های نرم‌افزاری (اتصال‌کننده) هستند که برای دسترسی به انواع سیستم‌های منبع و پایگاه‌های داده توسعه یافته‌اند. چنین رابط‌هایی نحوه استخراج داده‌های رویداد مربوطه از سیستم‌های منبع خاص و اینکه کدام تبدیل‌های اضافی باید اعمال شوند را تعریف می‌کنند. به این ترتیب، این ابزارها نویدبخش استخراج خودکار داده ها خواهند بود، مشکلی که بیش از یک دهه در جامعه دانشگاهی مطرح شده است.

 یکی از اولین چارچوب ها برای ورود داده‌ها مربوط به ابزار دانشگاهی Prom بود.  در همان روز‌ها، ایده معماری پلاگین توسعه‌یافته که توسعه آداپتورهایی برای اتصال به انواع زیادی از سیستم‌ها اجازه می‌دهد، پیشنهاد شد و تا حدی اجرا شد. با توسعه  XES، XESame به عنوان جانشین انعطاف‌پذیرتری برای چارچوب ورود Prom توسعه یافت. سایر محققان بر استخراج از سیستم های ERP تمرکز کرده اند، یکی دیگر از جریان های مهم تحقیق در حوزه استخراج رویداد به محوریت شی یا مصنوع (Artifact)می پردازد. بسیاری از سیستم های منبع، از جمله سیستم های ERP محبوب، داده ها را به جای ارائه یک دیدگاه واقعی از فرآیند در سطح منطقی اشیاء ذخیره می کنند. اغلب مفروضات در ادبیات اولیه فرآیندکاوی به یک گزارش رویداد مسطح نیاز دارند.

همبستگی داده‌ها:

نگاشت داده های رویداد استخراج شده از سیستم های منبع و پایگاه های داده به موارد (نمونه هایی از فرآیند کسب و کار تحت بررسی) به عنوان همبستگی (Correlation) نامیده می‌شود.  در مواردی که داده‌های رویداد به‌دست می‌آیند اما شناسه‌های موردی وجود ندارند، می‌توان یک فرآیند غیر ضروری برای تولید خودکار یا نیمه خودکار Case ID آغاز کرد. در یک زمینه علمی، چندین راه حل پیشنهاد شده است، که اکثر آنها بر روی استفاده از ویژگی های داده رویداد اضافی متمرکز شده اند.

 در موقعیت‌های عملی، مشکل مرتبط کردن داده‌های رویداد احتمالاً بیشتر به انواع منابع داده‌ای غیر یکپارچه که همگی بخشی از یک فرآیند کسب و کار را ضبط یا پشتیبانی می‌کنند مربوط می‌شود. به این ترتیب، این منابع مختلف بایستی یکپارچهه شوند. . در اینجا، به ویژه هنگامی که یک معماری انبار داده سازمانی وجود دارد، پردازش Extract-Transform-Load (ETL) یک فناوری پیش فرض برای استفاده خواهد بود. ابزارهای ETL برای استخراج و استقرار طرح‌های تطبیق برای ادغام داده‌ها از منابع داده غیر یکپارچه کاملاً مجهز هستند. با این وجود، یک رویکرد ETL که منجر به الگوی یکپارچه‌سازی داده‌ها می‌شود، تنها گزینه موجود نیست. به طور فزاینده ای، شرکت ها شروع به تمرکز بر معرفی لایه های مجازی سازی داده ها می کنند تا یکپارچگی داده ها را تحقق بخشند.

انتزاع داده های رویداد:

 در کنار استخراج و همبستگی، انتزاع به عنوان سومین شاخه از سه گانه آماده سازی داده رویداد فرآیند کاوی در نظر گرفته می شود. در بسیاری از سناریوهای دنیای واقعی، داده‌های رویداد در سطوح ریزدانگی بسیار دقیق‌تری در مقایسه با سطح فعالیت فرآیند تجاری قابل درک ذخیره می‌شوند. به این ترتیب، تکنیک های انتزاع را می توان به عنوان تکنیک های نقشه برداری در نظر گرفت که می تواند یک یا چند رویداد سطح پایین را به رویدادهای سطح بالاتر مربوط به فعالیت های فرآیند کسب و کار تبدیل کند.

در شکل زیر یک نمونه از تصویر کردن رویدادهای سطح پایین‌تر بر رویداد‌های سطح بالاتر دیده می‌شود.

انتزاع در فرآیندکاوی

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *