دادهکاوی فرآیندی است که در آن دادههای خام به اطلاعات ارزشمند تبدیل میشوند. همانطور که از نام دادهکاوی مشخص است در دادهکاوی اصولا به دنبال پیدا کردن الگوهایی هستیم که به طور عادی از نظر ما پنهان میماند. برای نمونه سازمانی که با استفاده از دادههای ثبت شده در پایگاههای داده میخواهد استراتژی بازاریابی موثرتری توسعه دهد و یا هزینهها را کاهش دهد.
داده کاوی شامل کاوش و تجزیه و تحلیل بلوک های بزرگ اطلاعات برای جمع آوری الگوها و روندهای معنادار است. می توان از آن به روش های مختلفی مانند شناسایی مشتریان با اولویت بالاتر ، شناسایی تقلب، فیلتر کردن ایمیل های هرزنامه یا حتی برای تشخیص احساسات یا نظرات کاربران استفاده کرد.
فرآیند داده کاوی به پنج مرحله تقسیم می شود. ابتدا سازمان ها داده ها را جمع آوری کرده و در انبارهای داده خود بارگذاری می کنند. در مرحله بعد، آنها داده ها را چه در سرورهای داخلی و چه در فضای ابری ذخیره و مدیریت می کنند. تحلیلگران کسب و کار، تیم های مدیریتی و متخصصان فناوری اطلاعات به داده ها دسترسی دارند و نحوه سازماندهی آنها را تعیین می کنند. سپس نرم افزار کاربردی داده ها را بر اساس نتایج کاربر مرتب می کند و در نهایت کاربر نهایی داده ها را در قالبی با قابلیت اشتراک گذاری آسان مانند نمودار یا جدول ارائه می کند.
نرم افزار های داده کاوی روابط و الگوهای موجود در داده ها را بر اساس درخواست کاربران تجزیه و تحلیل می کنند. به عنوان مثال، یک شرکت می تواند از نرم افزار داده کاوی برای ایجاد کلاس های اطلاعاتی مختلف استفاده کند. برای مثال، تصور کنید یک رستوران می خواهد از داده کاوی استفاده کند تا مشخص کند چه زمانی باید غذاهای ویژه ارائه دهد. به اطلاعاتی که جمع آوری کرده نگاه می کند و کلاس هایی را بر اساس زمان بازدید مشتریان و آنچه سفارش می دهند ایجاد می کند.
تکنیکهای دادهکاوی
داده کاوی از الگوریتم ها و تکنیک های مختلف برای تبدیل مجموعه های بزرگ داده به خروجی ارزشمند استفاده می کند. محبوب ترین انواع تکنیک های داده کاوی عبارتند از:
قوانین انجمنی: که به آن تحلیل سبد بازار نیز گفته می شود، روابط بین متغیرها را جستجو می کند. این رابطه به خودی خود ارزش اضافی را در مجموعه داده ایجاد می کند زیرا در تلاش برای پیوند دادن متغیرهای داده است. به عنوان مثال، قوانین انجمن تاریخچه فروش یک شرکت را جستجو می کند تا ببیند کدام محصولات بیشتر با هم خریداری می شوند. با این اطلاعات، فروشگاه ها می توانند بر اساس آن برنامه ریزی، تبلیغ و پیش بینی کنند.
طبقه بندی: در این تکنیک یک متغیر هدف برای هر مجموعهای از داده مشخص میشود. برای نمونه فروشگاهی برای مشتریان ویژگیهای ثبت شده در سیستم اطلاعاتی مشخص میکند که آیا میزان خرید بالای 10 میلیون تومان صورت گرفته یا خیر سپس بر اساس این متغیر هدف میزان خرید مشتریان با ویژگی ها مختلف پیشبینی میشود.
خوشه بندی مشابه طبقه بندی است. با این تفاوت که متغیر هدفی از پیش تعریف شده وجود ندارد. در واقع در مثال قبل میخواهیم بدانیم کدام مشتریان ویژگیهای نزدیک به یکدیگردارند تا آنها را در یک دسته قرار داده و به طور یکسان استراتژی بازاریابی را در مورد آنها اعمال کنیم.
فرآیندکاوی
فرآیند کاوی مسیرهای دادهاه را در سیستمهای نرمافزاری یک شرکت، بهویژه سیستم برنامهریزی منابع سازمانی (ERP) آن، تجزیه و تحلیل میکند تا متوجه شود برای تکمیل یک فرآیند کسب و کار خاص، چقدر فرآیندها خوب اجرا میشوند و چه انحرافاتی در اجرای آنها وجود دارد. مدیریت فرآیند کسب و کار یک چرخه از اقدامات به هم وابسته برای کشف ، بهبود و پیادهسازی فرآیندهای سازمان ها است. بااین حال یک چالش عمده در آن استفاده از مصاحبه و سایر اقدامات ذهنی برای کشف و تحلیل فرآیندها است. این در حالی است که فرآیند کاوی از داده های عینی در سیستم های سازمان استفاده می کند.
نرم افزار فرآیند کاوی فرآیندهای پیچیده، مانند مدیریت زنجیره تامین و سفارش ، خرید و مدیریت شکایات مشتریان را تجزیه و تحلیل می کند. به عنوان مثال، فرآیند کاوی ممکن است گلوگاههایی را در زنجیره تامین آشکار کند و برای فرآیندهای سفارش، ممکن است نقاطی راو تجزیه و تحلیل کند که مشخص شود ، تنظیم اعتبار برای مشتریان خاص باعث تاخیرهای غیرضروری در فرآیند می شود.
برای مطالعه بیشتر در مورد فرآیندکاوی این مقاله را مطالعه نمایید
https://processanalyst.ir/what-is-process-mining/
مقایسه فرآیندکاوی و دادهکاوی
داده کاوی و فرآیند کاوی اشتراکات زیادی دارند، اما متفاوت هستند.
داده کاوی و فرآیند کاوی هر دو زیر چتر هوش تجاری (هوشمندی کسب و کار (BI قرار می گیرند. هر دو از الگوریتمهایی برای درک دادههای بزرگ استفاده میکنند و همچنین ممکن است از یادگیری ماشین استفاده کنند. هر دو می توانند به کسب و کارها در بهبود عملکرد کمک کنند.
با این حال، این دو حوزه متمایز هستند. فرآیند کاوی بیشتر به نحوه تولید اطلاعات و نحوه انطباق آن با یک فرآیند به عنوان یک کل مربوط می شود، در حالی که داده کاوی به داده های موجود متکی است. داده کاوی بیشتر به چیستی – یعنی خود الگوها – می پردازد در حالی که فرآیند کاوی به دنبال پاسخ به چرایی آن است. به عنوان مثال فرآیند کاوی استثناهای موجود در فرآیند را بررسی میکند و داستانی که این استثناها به بیان پاسخ جامع کمک می کنند، در حالی که داده کاوی استثناها را کنار می گذارد، زیرا موارد پرت می توانند از یافتن الگوهای اصلی جلوگیری کنند. فرآیندکاوی در واقع توالی اجرای فعالیتها در فرآیند را به عنوان یک شاخص بسیار مهم در فرآیندهای سر به سر دخیل مینماید و به دنبال پیدا نمودن مشکلات فرآیندی (انحرافات، گلوگاهها و دوبارهکاریها) ودلایل ایجاد آن است.
الگوها در مقابل فرآیندها
ما از داده کاوی برای تجزیه و تحلیل داده ها و شناسایی یا پیش بینی الگوها استفاده می کنیم. به عنوان مثال: کدام گروه های هدف کدام محصولات را می خرند، کمپین بازاریابی من در کجا بیشترین تأثیر را دارد و غیره … داده کاوی برخلاف فرآیند کاوی هیچ ارتباط مستقیمی با فرآیندهای کسب وکار ندارد. فرآیندکاوی اما بر کشف، کنترل و بهبود فرآیندهای کسب و کار واقعی تمرکز دارد. با تجزیه و تحلیل داده های به دست آمده از سیستم های فناوری اطلاعات که از فرآیندهای ما پشتیبانی می کنند، فرآیند کاوی یک دیدگاه واقعی و کامل از نحوه عملکرد فرآیندهای تجاری به ما می دهد.
ایستایی در مقابل پویایی
داده کاوی اطلاعات ایستا را تجزیه و تحلیل می کند. به عبارت دیگر: داده هایی که در زمان تجزیه و تحلیل در دسترس هستند. از سوی دیگر فرآیند کاوی به چگونگی ایجاد داده ها نگاه می کند. تکنیک های فرآیند کاوی همچنین به کاربران این امکان را می دهد که فرآیندها را به صورت پویا بر اساس جدیدترین داده ها تولید کنند. فرآیند کاوی حتی میتواند نمای لحظهای از فرآیندهای تکسب و کار را از طریق یک منبع زنده ارائه دهد.
نتایج در مقابل علل
تجزیه و تحلیل داده کاوی الگوهای خاصی را نشان می دهد، اما به این سؤال پاسخ نمی دهد که چگونه آن الگوها ایجاد شده اند. داده کاوی صرفاً به تجزیه و تحلیل نتایج محدود می شود. از طرف دیگر فرآیند کاوی می تواند بینشی در مورد چگونگی رسیدن به نتایج ارائه دهد. این تکنیک الگوها را در دادهها جستجو نمیکند، بلکه فرآیندهای علی را جستجو میکند.
جریان اصلی در مقابل انحرافات
در داده کاوی، تمرکز بر الگوهای اصلی در یک مجموعه داده مهم است. داده هایی که خارج از این الگوهای جریان اصلی قرار می گیرند اغلب در تجزیه و تحلیل گنجانده نمی شوند. در فرآیند کاوی، استثناها گاهی اوقات می توانند حداقل به همان اندازه مهم باشند. استثناها ممکن است نشانه اولیه ناکارآمدی یا فرصت های بهبود باشند.
بدون دیدگاه