آمادهسازی گزارش رویداد فرآیندکاوی اغلب شامل سه نوع تکنیک است: استخراج (Extraction)، همبستگی (Correlation) و انتزاع (Abstraction) با این حال احتمالاً این سه تکنیک اغلب از هم گسسته نیستند، شکل زیر رابطه بین این نوع تکنیک ها و مفاهیم اساسی فرآیندکاوی را نشان می دهد.
در ادامه، خلاصه ای از ابزارها و تکنیک های گزارش شده برای انتزاع، همبستگی و انتزاع داده های رویداد ارائه خواهیم کرد.
استخراج داده :
استخراج داده به به دست آوردن دادههای رویداد از سیستمهای منبع (اغلب پایگاههای اطلاعاتی زیربنای انواع سیستمهای اطلاعاتی) اشاره دارد. به طور کلی، داده های ذخیره شده در چنین پایگاه های دادهای با دیدگاه فرآیندی که در ذهن وجود دارد ثبت نمی شوند و بنابراین به طور خودکار مفاهیم اساسی مانند رویدادها و دنبالهها را منعکس نمی کنند. بنابراین ، شناسایی داده های رویداد مربوطه یک چالش اولیه است که اغلب به دانش قوی خبره نیاز دارد.
هنگام بررسی راه حل ها برای استخراج داده های رویداد باید دو دیدگاه از هم جدا شوند. از یک طرف، نرم افزار تجاری فرآیندکاوی وجود دارد، که در آن فروشندگان تمرکز استراتژیک روشنی را برای رسیدگی به چالش های ناشی از استخراج گزارش رویدادها اتخاذ کرده اند. بر این اساس، اکثر ابزارهای تجاری فرآیند کاوی دارای راهحلهای نرمافزاری (اتصالکننده) هستند که برای دسترسی به انواع سیستمهای منبع و پایگاههای داده توسعه یافتهاند. چنین رابطهایی نحوه استخراج دادههای رویداد مربوطه از سیستمهای منبع خاص و اینکه کدام تبدیلهای اضافی باید اعمال شوند را تعریف میکنند. به این ترتیب، این ابزارها نویدبخش استخراج خودکار داده ها خواهند بود، مشکلی که بیش از یک دهه در جامعه دانشگاهی مطرح شده است.
یکی از اولین چارچوب ها برای ورود دادهها مربوط به ابزار دانشگاهی Prom بود. در همان روزها، ایده معماری پلاگین توسعهیافته که توسعه آداپتورهایی برای اتصال به انواع زیادی از سیستمها اجازه میدهد، پیشنهاد شد و تا حدی اجرا شد. با توسعه XES، XESame به عنوان جانشین انعطافپذیرتری برای چارچوب ورود Prom توسعه یافت. سایر محققان بر استخراج از سیستم های ERP تمرکز کرده اند، یکی دیگر از جریان های مهم تحقیق در حوزه استخراج رویداد به محوریت شی یا مصنوع (Artifact)می پردازد. بسیاری از سیستم های منبع، از جمله سیستم های ERP محبوب، داده ها را به جای ارائه یک دیدگاه واقعی از فرآیند در سطح منطقی اشیاء ذخیره می کنند. اغلب مفروضات در ادبیات اولیه فرآیندکاوی به یک گزارش رویداد مسطح نیاز دارند.
همبستگی دادهها:
نگاشت داده های رویداد استخراج شده از سیستم های منبع و پایگاه های داده به موارد (نمونه هایی از فرآیند کسب و کار تحت بررسی) به عنوان همبستگی (Correlation) نامیده میشود. در مواردی که دادههای رویداد بهدست میآیند اما شناسههای موردی وجود ندارند، میتوان یک فرآیند غیر ضروری برای تولید خودکار یا نیمه خودکار Case ID آغاز کرد. در یک زمینه علمی، چندین راه حل پیشنهاد شده است، که اکثر آنها بر روی استفاده از ویژگی های داده رویداد اضافی متمرکز شده اند.
در موقعیتهای عملی، مشکل مرتبط کردن دادههای رویداد احتمالاً بیشتر به انواع منابع دادهای غیر یکپارچه که همگی بخشی از یک فرآیند کسب و کار را ضبط یا پشتیبانی میکنند مربوط میشود. به این ترتیب، این منابع مختلف بایستی یکپارچهه شوند. . در اینجا، به ویژه هنگامی که یک معماری انبار داده سازمانی وجود دارد، پردازش Extract-Transform-Load (ETL) یک فناوری پیش فرض برای استفاده خواهد بود. ابزارهای ETL برای استخراج و استقرار طرحهای تطبیق برای ادغام دادهها از منابع داده غیر یکپارچه کاملاً مجهز هستند. با این وجود، یک رویکرد ETL که منجر به الگوی یکپارچهسازی دادهها میشود، تنها گزینه موجود نیست. به طور فزاینده ای، شرکت ها شروع به تمرکز بر معرفی لایه های مجازی سازی داده ها می کنند تا یکپارچگی داده ها را تحقق بخشند.
انتزاع داده های رویداد:
در کنار استخراج و همبستگی، انتزاع به عنوان سومین شاخه از سه گانه آماده سازی داده رویداد فرآیند کاوی در نظر گرفته می شود. در بسیاری از سناریوهای دنیای واقعی، دادههای رویداد در سطوح ریزدانگی بسیار دقیقتری در مقایسه با سطح فعالیت فرآیند تجاری قابل درک ذخیره میشوند. به این ترتیب، تکنیک های انتزاع را می توان به عنوان تکنیک های نقشه برداری در نظر گرفت که می تواند یک یا چند رویداد سطح پایین را به رویدادهای سطح بالاتر مربوط به فعالیت های فرآیند کسب و کار تبدیل کند.
در شکل زیر یک نمونه از تصویر کردن رویدادهای سطح پایینتر بر رویدادهای سطح بالاتر دیده میشود.
بدون دیدگاه