مطرح‌ترین نرم‌‌افزارها در حوزه تحلیل‌های پیشرفته و داده‌کاوی کدامند؟

نویسنده: حمید یزدانی‌نژاد - واحد مدیریت محصول همکاران سیستم

بر اساس آخرین گزارش‌های موسسات تحقیقاتی معتبر بین المللی، بازار جهانیِ هوشمندی تجاری در سال‌های اخیر رشد و تغییرات بسیاری داشته‌اند. ایجاد فناوری‌های نوین IT در این زمینه سبب شده‌اند تا تولیدکنندگان نرم‌افزار، کاربردهای جدیدی را برای کسب‌و‌کارها و سازمان‌های انتفاعی و غیرانتفاعی مختلف در سراسر جهان فراهم کنند.

بر اساس تعریف موسسه Gartner، بازار جهانی راهکارهای مبتنی بر Analytics در سال ۲۰۱۶، به سه دسته‌ی زیر تقسیم شده است.

مطرح‌ترین نرم‌‌افزارها در حوزه تحلیل‌های پیشرفته و داده‌کاوی کدامند؟

در در ادامه؛ با نگاهی به تحقیقات معتبر جهانی، به معرفی شرکت‌ها و راهکارهای معتبر در حوزه‌ی تحلیل‌های پیشرفته یا  Advanced Analytics خواهیم پرداخت. هم‌چنین در این مقاله و مقاله‌ی بعدی؛  پرکاربردترین نرم‌افزار این حوزه یعنی R را معرفی خواهیم کرد.

بازار جهانی نرم‌افزارهای تحلیل پیشرفته

داده‌کاوی فرآیندی برای کشف روابط معنی‌دار، الگو‌ها و گرایش‌ها با بررسی حجم زیادی از داده‌ها است. گرو‌ها، دانشگاه‌ها، مراکز علمی و شرکت‌های زیادی در حوزه داده‌کاوی نرم‌افزارهایی را توسعه داده و به بازار معرفی کرده‌اند. آخرین رتبه‌بندی شرکت‌های پیش‌رو در حوزه بازار تحلیل‌های پیشرفته (Advanced Analytics Platforms) بر اساس گزارش موسسه‌ی گارتنر در تصویر زیر نشان داده شده است. در سال ۲۰۱۶ شرکت‌های SAS، IBM، KNIME، RapidMiner، Dell و Microsoft به عنوان اصلی‌ترین بازیگران بازار جهانی نرم‌افزارهای تحلیل پیشرفته و داده‌کاوی مطرح محسوب می‌شوند. شرکت‌های Microsoft و Dell با خرید شرکت‌های Revolution Analytics و Statsoft توانسته اند رشد قابل‌توجهی را در این بازار تجربه کنند.

مطرح‌ترین نرم‌‌افزارها در حوزه تحلیل‌های پیشرفته و داده‌کاوی کدامند؟

از سوی دیگر،  نرم‌افزارهای حوزه داده‌کاوی را می‌توان به دو طبقه Open source و Commercial تقسیم کرد. رتبه‌بندی و شاخص‌های آماری استفاده از این ابزارها در سال ۲۰۱۶ به گزارش سایت KDnuggets را در جدول و نمودار زیر مشاهده می‌کنید. این بررسی به‌واسطه‌ی یک پژوهش جهانی از حدود ۳۰۰۰ کاربر انجام شده است.

مطرح‌ترین نرم‌‌افزارها در حوزه تحلیل‌های پیشرفته و داده‌کاوی کدامند؟
مطرح‌ترین نرم‌‌افزارها در حوزه تحلیل‌های پیشرفته و داده‌کاوی کدامند؟

همان‌طور که مشاهده می‌شود، R در سال‌های اخیر به عنوان پرکاربردترین زبان و نرم‌افزار در حوزه‌ی داده‌کاوی مطرح بوده است، به دلیل اهمیت این نرم افزار در این مقاله و  مقاله‌ی بعدی به معرفی ابعادی از زبان R و کاربردهای آن پرداخته شده است.

پیدایش R

پروژه‌ی R در سال ۱۹۹۱ در گروه آمار دانشگاه Auckland کشور نیوزلند آغاز شد و نام آن از حرف اول پدیدآورندگانش (Ross Ihaka و Robert Gentleman) اقتباس شده است. زبان R، یک زبان برنامه‌نویسی و یک محیط نرم‌افزاری برای محاسبات آماری و تحلیل داده است. R فرزند متن‌باز S بوده و بسیاری از کدهایی که با S نوشته شده بدون تغییر در R اجرا می‌شود.

زبان S توسط تیم آزمایشگاه‌های بل (Bell Labs) از جمله جان چمبرز (John Chambers) که در سال ۱۹۹۸ موفق شد جایزه‌ی معتبر ACM Software System را دریافت کند، توسعه یافته است. پدید آورندگان R تصمیم گرفتند زبانی تولید کنند که تدریس دوره‌های مقدماتی تجزیه و تحلیل داده‌ها را برای آنها آسان‌تر کند؛ اما اخبار زبان جدید به سرعت منتشر شد و آنها در سال ۱۹۹۵ متقاعد شدند که منبع کد R را تحت مجوز GNU وابسته به بنیاد نرم‌افزارهای آزاد در دسترس عموم قرار دهند. تصمیم آن‌ها مبنی بر به اشتراک‌گذاری رایگان R، نقطه عطفی در تاریخ توسعه نرم‌افزارهای تحلیلی به شمار می‌رود‌.

زبان R، توسط نرم‌افزاری به همین نام که شامل مفسر زبان و محیط اسکریپت‌نویسی است پشتیبانی می‌شود. نسخه‌های R به‌صورت رایگان و برای انواع سیستم عامل‌ها ارائه شده است. هسته‌ی اصلی نرم‌افزار R به همراه بیش از ۴۳۰۰ پکیج در کتابخانه‌ای با عنوان شبکه CRAN در دسترس است. امکان توسعه‌ی قابلیت‌های R، با افزودن بسته‌های ایجاد شده توسط کاربران آن، یکی از ویژگی‌های مهم این نرم‌افزار است. این بسته‌ها به زبان‌های R، LaTeX، جاوا، سی++ و فورترن نوشته شده‌اند. مجموعه‌ای از بسته‌های اصلی R، هنگام نصب همراه برنامه وجود دارند و در سال ۲۰۱۵ بیش از ۶۵۰۰ بسته در شبکه جهانی CRAN ایجاد شده‌اند.

مطرح‌ترین نرم‌‌افزارها در حوزه تحلیل‌های پیشرفته و داده‌کاوی کدامند؟

مهم‌ترین ویژگی‌های R را می‌توان در موارد زیر خلاصه کرد:

  • یک پلتفرم زبان برنامه‌نویسی آماری (یک زبان متن باز بهینه شده‌ی اختصاصی برای آمار و علم داده)
  • یک جامعه بزرگ استفاده کننده (بیش از ۲.۵ میلیون کاربر متخصص در حوزه تحلیل داده و یادگیری ماشینی)
  • یک اکوسیستم خود سازمانده و خود ارتقا دهنده (بیش از ۶۰۰۰ الگوریتم رایگان در دسترس)

شرکت Revolution Analytics که در سال ۲۰۰۷ تاسیس شده است، و تولیدکننده‌ی نرم‌افزاری آماری است که از هسته‌ی متن باز  open source و open core نرم افزار R استفاده می‌کند و اختصاصا برای استفاده‌های Enterprise کاربرد دارد. این شرکت با سرمایه‌‌گذاری شرکت intel توانست قابلیت‌های محصولی خود را توسعه دهد و در سال ۲۰۱۰ نرم‌افزار Revolution R Enterprise را در دو نسخه‌ی رایگان و تجاری عرضه کند. در سال ۲۰۱۵ شرکت Microsoft این شرکت را خرید و با ایجاد تغییرات اساسی در ساختار و مدل‌های یکپارچگی آن، قابلیت‌های R را به پلتفرم SQL ۲۰۱۶ اضافه کرد. در همین راستا، تغییراتی در برندینگ و طبقه‌بندی نرم‌افزاری ارائه‌شده‌ی قبلی مطابق آن‌چه در تصویر زیر می‌بینید، ایجاد شد و در حال حاضر نرم‌افزارهای شرکت Revolution Analytics در قالب برند مایکروسافت و به عنوان بخشی از محصولات این شرکت عرضه می‌شوند.

مطرح‌ترین نرم‌‌افزارها در حوزه تحلیل‌های پیشرفته و داده‌کاوی کدامند؟

در مقاله‌های بعدی، به ابعاد بیشتری از نرم‌افزار R  خواهیم پرداخت.


منابع:

  • microsoft.com
  • gartner.com
  • kdnuggets.com