وجه مشترک تحلیل‌های داده محور استفاده آن‌ها از داده ها است. فرآیندکاوی به عنوان یک تحلیل داده محور نیز از این قاعده مستثنا نیست. یعنی پیش نیاز و پایه تکنیک های فرآیند کاوی مانند کشف فرآیند بررسی انطباق و بهبود فرآیند وجود داده ها کامل و باکیفیت است. معمولا داده های فرآیندی از سیستم های ERp Bpms  مالی انبار Srm و تمامی سیستم هایی اطلاعاتی که فرآیند های ما را پشتیبانی می کند به دست می آید. گاهی وقت ها نیاز است که داده های سیستم های مختلف با هم جوین شوند تا داده مورد نیاز ما برای انجام تحلیل های فرآیند کاوی حاصل شود بنابراین داده های ما برای برای شروع تحلیل های فرآیندکاوی باید ساختار خاصی داشته باشد. ما به داده هایی که چنین ساختاری را داشته باشد گزارش رویداد یا Event log می‌گوییم.

جدول 1. یک نمونه از گزارش رویداد .( هر سطر متعلق یه یک Event است)

جدول 1 اطلاعات معمول موجود در گزارش رویداد را نشان می دهد. بسته به تکنیک فرآیند کاوی مورد استفاده و سوالات موجود، تنها بخشی از این اطلاعات استفاده می شود. حداقل الزامات برای فرآیند کاوی این است که هر رویدادی می تواند هم به یکCase  و هم به یک فعالیت Activity  مرتبط باشد و رویدادهای درون یک Case مرتب شوند. از این رو، ستون های “case id” و “activity” و “”timestamp در جدول 1 حداقل داده مورد نیازرا برای فرآیند کاوی نشان می دهند. با نمایش اطلاعات در این دو ستون، نمایش فشرده تری را به دست می آوریم که در جدول 2 نشان داده شده است. در این جدول، هر مورد با توالی مشخصی از فعالیت ها نشان داده می شود که به آنها دنباله (Trace) نیز گفته می شود. برای وضوح، نام فعالیت ها به برچسب های تک حرفی تبدیل شده است، به عنوان مثال، a درخواست ثبت فعالیت را نشان می دهد.

جدول2. گزارش رویداد به طور فشرده

گزارش رویداد موجود  در جدول 2 عموما برای تکنیک‌های کشف فرآیند مورد استفاده قرار می‌گیرند. با این حال برای تعریف شاخص‌های کلیدی عملکرد و بهبود مدل‌های فرآیندی از منظر‌های مختلف نیازمند ستون ویژگی‌های بیشتر هستیم. در .واقع هر قدر داده‌های مربوط به فایل گزارش رویداد بیشتر باشد تحلیل‌ها و شاخص‌های تعریف شده بیشتر بوده و متعاقبا بینش‌های ارزشمندتری حاصل می‌شود. برای نمونه برای فعالیت‌های مختلف می‌توان ستون ویژگی‌های هزینه، ریسک، منابع و … را تعریف کرد. ستون ویژگی منابع بیانگر افراد یا سخت افزار‌هایی است که یک فعالیت مشخص توسط آن انجام می‌گردد. با وجود ستون منابع  تحلیل‌های مربوط ارزشمند وظیفه‌کاوی قابل اجرا خواهند بود.

یکی از مسائل مهم در ایجاد ستون‌های ویژگی‌گزارش‌های رویداد ارتباط هریک از ویژگی‌ها با Event یا Case ها است. در واقع ستون‌های ویژگی موجود در گزارش رویداد می‌توانند به 2 دسته مرتبط با Case و یا مرتبط با Event تقسیم شوند. اگر این ستون‌ها به ازای هریک از سطر ها متفاوت باشند می‌گوییم این ستون ها مرتبط با Event هستند اما اگر این ویژگی‌ها با تغییر Case عوض شوند گفته می‌شود که این ویژگی ها مرتبط با Case هستند. برای نمونه ستون ویژگی منابع را در نظر بگیرید. از آنجا که هر فعالیت توسط یک شخص یا سخت افزار متفاوتی اجرا می‌شود این ویژگی مرتبط به Event ها است . در جدول 1 فعالیت با Eventid 35654423 که ثبت درخواست (Register Request) است توسط فردی با نام Pete انجام می‌شود اما فعالیت تصمیم (Decide ) توسط Sara اجرا می‌شود. ستون ویژگی هزینه نیز از این نوع است.

اما فرآیند درخواست خرید کالا را درنظر بگیرید در این فرآیند نوع کالایی که برای خرید مورد نظر است به ازای فعالیت‌های مختلف تغییر نمی‌کند اما از یک نمونه اجرا به یک نمونه اجرای دیگر تفاوت خواهد داشت. به چنین ستونی از ویژگی‌هایی مرتبط با Case می‌گوییم. برای مثال خرید کالای گوشی موبایل به ازای هریک از فعالیت‌های ثبت درخواست، بررسی درخواست ، تایید درخواست تغییری نخواهد داشت .

همیشه باید در نظر داشته باشیم که بخش قابل توجهی از زمان صرف شده در اجرای تکنیک‌های فرآیند‌کاوی صرف پیش پردازش داده‌ها می‌گردد. پیش پردازش داده‌ها شامل استخراج، تمیز کردن داده‌ها ، حذف داده‌های نویز و فیلتر کردن آن‌ها است. در واقع بدون داشتن داده‌های تمیز و کامل تکنیک‌های فرآیندکاوی منجر به ایجاد بینش ارزشمندی برای سازمان نمی‌گردد. از این رو ایجاد زیر ساخت‌های داده‌ای مناسب که داده‌های فرآیند‌ی را در سطح مناسبی برای سازمان ثبت نماید به منظور تحلیل‌های داده‌محور نظیر فرآیند‌کاوی ضرروری به نظر می‌رسد.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *