یادداشت (درباره بیگ دیتا بیشتر بدانیم)

به تناسب پیشرفتهای پی در پی در حوزه تکنولوژی و فناوری اطلاعات و ارتباطات، مفاهیم جدیدی به منصه‌ی ظهور میرسد که به نوبه ی خود فرصتها، مخاطرات و چالشهایی را به همراه می آورد. یکی از این مفاهیم جدید بیگ دیتا، کلان داده یا داده های عظیم است که روز به روز نیز بر اهمیت آن افزوده شده و از ظرفیتها و قابلیتهای فراوانی برخوردار است.

الف) بیگ دیتا (Big Data) به چه مفهومی است؟
ارائه تعریفی دقیق از بیگ دیتا دشوار است. بیگ دیتا به زبان ساده یعنی: “مجموعه داده¬هایی که اندازه¬ی آنها فراتر از حدی است که با نرم افزارها یا روشهای معمول بتوان آنها را در یک زمان قابل قبول، دریافت، ذخیره، مدیریت و پردازش کرد.”
در تعریفی دیگر بیگ دیتا عبارت است از جمع آوری حجم زیادی از داده از منابع مختلف که اغلب ساختار مشخصی ندارند. به عبارت دیگر بیگ دیتا اصطلاحی است که برای مجموعه داده های حجیم استفاده می شود که بزرگ، متنوع و با ساختار پیچیده هستند و برای ذخیره سازی ، تحلیل و تصویرسازی (نمایش) و پردازشهای بیشتر با دشواری مواجه هستند. البته داده به خودی خود مفهوم جدیدی نیست و در سالهای گذشته نیز وجود داشته است. امّا آنچه به عنوان بیگ دیتا مطرح است تفاوتهایی با داده های سنتی دارد.
تفاوت اول در حجم است. حجم داده های سنتی در محدوده ی گیگابایت تا ترابایت است. در حالیکه در بیگ دیتا با داده هایی در حجم پتابایت تا اگزابایت و حتی زتابایت مواجه هستیم. دلیل این امر، تولید مداوم داده توسط ابزارها و سیستمهای دیجیتال است که روز به روز بر حجم این داده ها می افزاید.
تفاوت دوم در ساختار است. داده های سنتی متمرکز بوده و ساختاری منسجم دارند در حالیکه بیگ دیتا غیرمتمرکز و توزیع شده است و ساختار منسجمی نیز ندارد (بدون ساختار/ نیم ساختار). علاوه بر این مدل داده ها در داده های سنتی مدلی ثابت است در حالیکه بیگ دیتا مدل مشخص و ثابتی ندارند. ارتباطات داخلی بین داده های سنتی نیز پیچیده است در حالیکه در بیگ دیتا ارتباط داخلی پیچیده ای بین داده ها وجود ندارد.
فرآیند جمع آوری بیگ دیتا ابتدائا با هدف ثابتی نیست. مقدار زیادی داده جمع آوری میشود و اینکه ارزش یا پتانسیل استفاده از داده چقدر است بعد از جمع آوری مشخص می گردد. به همین دلیل گفته می شود که داده ها برای اهدافی جمع آوری شده اند که از قبل بطور دقیق مشخص نشده اند.

ب) ویژگی های بیگ دیتا:
سه ویژگی خاص بیگ دیتا که به عنوان معیاری برای شناسایی آن هستند عبارتند از مقدار (volume)، نوع (variety) و سرعت پردازش (velocity) که معروف به ۳v هستند.
حجم داده ها(volume): مقدار داده ها در این مجموعه های داده ای بالاست. این حجم یکی از ویژگی هایی است که برای بیگ دیتا به عنوان یک خصیصه اصلی شناسایی می شود. حجم داده ها در جهان امروز رو به افزایش است و در پردازش داده ها باید در نظر گرفته شود.
انواع داده های گوناگون (variety): داده هایی که در گروههای بیگ دیتا قرار می گیرند شامل انواع مختلف داده ای از قبیل عکس، متن، ویدئو و… هستند که از منابع گوناگونی به دست آمده اند.
سرعت پردازش (velocity): سرعت خلق، جریان، پردازش و تجمییع اطلاعات باید به گونه¬ای باشد که متناسب با ویژگی¬های گروههای داده ای امروزی عمل کند. با توجه به سرعت تولید اطلاعات در دنیای امروزی و نیاز به پاسخگویی بلادرنگ در بسیاری از برنامه های کاربردی و شبکه های اجتماعی، سرعت عمل و پردازش روی داده ها باید به گونه ای باشد که متناسب با این ویژگی ها انجام شود.

ج) قلمرو بیگ دیتا چیست؟
پروژه‌‌های بیگ‌‌دیتا با اهداف متفاوت متعددی آغاز میشوند. برای مثال در برزیل سیستم دیتا وایو ( Data Viva system) برای تنظیم سیاستهای اقتصادی ایجاد شد. همچنین پلیس سائوپائولو نیز از سیستمی به نام دتکتا (Detecta) استفاده میکند که مبتنی بر تکنولوژی بیگ دیتاست. دتکتا یک سیستم هوشمند برای نظارت بر جرائم است. در انگلستان نیز از بیگ دیتا برای مبارزه با جرائم استفاده میشود. نرم افزار Postnote نمونه ای از استفاده از بیگ دیتا در کشف جرائم توسط پلیس است که برای کشف محل و موقعیت جرائم به کار میرود. همچنین سازمان مالیات و گمرک بریتانیا نیز از سیستم بیگ‌‌دیتا به نام “کانکت” استفاده میکند که تمام داده‌‌ها را ذخیره و تحلیل مینماید. سیستم بیگ دیتا برای کشف تقلب مالیاتی و فرار مالیاتی مورد استفاده است که از آوریل ۲۰۱۳ تا کنون به کشف شش و دو دهم میلیارد دلار جرم مالیاتی منتهی شده است. این سیستم اطلاعات مرتبطی را در حین جستجوها نمایش میدهد که در حالت عادی به سادگی قابل دستیابی نیست. همچنین تحلیلهای پیچیده ای را بر مجموعه داده‌‌ها اعمال میکند و پروفایلهایی را میسازد که در شناسایی جرم کمک میکند.
در برخی کشورها دولتها از بیگ دیتا برای افزایش خدمات به شهروندان استفاده میکنند مانند استرالیا و چین. در کشور هند پروژه ای به نام “آدهار” (Aadhaar) وجود دارد که اطلاعات زیست سنجشی و جمعیت شناختی ساکنان هند را ذخیره میکند. یکی از کاربردهای آدهار، میکروپیمنت (Micropayments) است که یک وسیله‌‌ی شناسایی است که دسترسی به سیستمهای مالی را برای ساکنان نواحی روستایی تسهیل میکند. کد شناسایی این امکان را فراهم میکند تا مردم در نواحی بسیار دوردست شناسایی شوند و به راحتی بتوانند خدمات مالی دریافت کنند.
کشورهای متعددی نیز هستند که بیگ دیتا را پدیده‌‌ای میدانند که به تقویت اقتصاد خصوصی کمک میکند. برای مثال آلمان یک سیستم تأمین مالی ایجاد کرده است تا از رقابت پذیری شرکتها حمایت کند.
فرانسه نیز بیگ دیتا را بستری قابل پیشرفت میداند که به طور خاص در بخش خصوصی از طریق رشد شرکتها و استارت آپ ها، به تقویت اقتصاد و ایجاد اشتغال کمک میکند.
در کشورهایی مانند ژاپن، آلمان و انگلستان، بیگ دیتا ارتباط تنگاتنگی با تحقیقات علمی و توسعه دارد. اما در این بین آنچه اسرائیل را در آن منحصر به فرد است این است که از سیستمهای تکنولوژیک نیز برای تسهیل فعالیتهای ارتش استفاده میکند. شایان ذکر است که بسیاری از خدمات جاسوسی و اطلاعاتی با پروژه‌‌های بیگ دیتا آمیخته‌‌اند. ولیکن درباره این پروژه‌‌ها اطلاعات زیادی موجود نیست.

در کل استفاده از بیگ دیتا به سه نوع تقسیم میشود:
نوع اول: استفاده از بیگ دیتا برای وظایف و فعالیتهای خاص و ویژه‌‌ی دولت مانند استفاده از بیگ دیتا در سرویس‌‌های اطلاعاتی، پلیس، مقامات مالیاتی و دیگر بخشهای دولتی برای مثال در زمینه‌‌ی تعیین سیاستهایی اقتصادی.
نوع دوم: استفاده از بیگ دیتا توسط بخش خصوصی یا بخش نیمه دولتی که این بخشها را در رسیدن به اهداف خاص مرتبط با وظایفشان یاری میکند. برای مثال استفاده از بیگ دیتا توسط شرکتها برای ایجاد پروفایل ریسک به منظور یافتن همبستگی های آماری، و شخصی سازی خدمات و تبلیغات. همچنین دانشگاه‌‌ها و مؤسسات تحقیقاتی برای اهداف پژوهشی خود از بیگ دیتا استفاده میکنند. بیگ دیتا همچنین به طور گسترده توسط بخش پزشکی مورد استفاده قرار میگیرد. برای مثال انگلستان استفاده از بیگ دیتا در بخش بهداشت و درمان را به طور جدی افزایش داده است. وزارت بهداشت اسرائیل نیز مجموعه داده‌‌های عظیمی از اطلاعات شهروندان اسرائیلی را در اختیار دارد. این امر منافع بالقوه‌‌ای را به همراه دارد از جمله اینکه در فرآیند تصمیم گیری ‌‌های پزشکی ، نظارت بر بیماری ها و خدمات درمانی مبتکرانه مورد استفاده قرار میگیرد.
نوع سوم: استفاده از بیگ دیتا توسط دولت و هم شرکتهای خصوصی است تا خدمات خود به شهروندان و مشتریان خود را بهبود بخشند که شامل فعالیتهایی همچون افزایش شفافیت در امور و استقرار و تحکیم کنترل شهروندان بر پردازش داده‌‌ها و دیگر مسائل است.
این سه دسته، به رویکردهای متفاوتی نسبت به قانونگذاری منتهی میشوند. دسته‌‌ی سوم مشکلی را به همراه ندارد زیرا در خدمت منافع شهروندان است. در اینجا قوانین فعلی درباره‌‌ی استفاده از اطلاعات شخصی کفایت میکند. اما در شرایطی که سازمانهای دولتی از بیگ دیتا برای رسیدن به اهدافشان استفاده میکنند وضعیت متفاوت است. هنگام وضع قوانین در خصوص بیگ‌‌دیتا، تأثیر بالقوه‌‌ی آن بر شهروندان باید درنظر گرفته شود؛ این تأثیر، در زمانی که بیگ‌‌دیتا توسط پلیس یا سازمانهای اطلاعاتی یا ارتش مورد استفاد قرار میگیرد، نسبت به زمانی که برای توسعه‌‌ی سیاستهای اقتصادی مورد استفاده قرار میگیرد، بیشتر خواهد بود. از نظرسنجی صورت گرفته نیز مشخص است که بسیاری از مراجع حمایت از داده‌‌ها نسبت به استفاده‌‌ی پلیس از بیگ دیتا تردید دارند که هم به خاطر تأثیر احتمالی بر شهروندان و هم به دلیل امکان وجود تشخیص‌‌های اشتباه در تطبیق پروفایلها بر شهروندان است.
البته استفاده از بیگ دیتا در بخش خصوصی نیز میتواند مشکل آفرین باشد. در این قسمت باید به دو نکته توجه داشت:
نکته‌‌ی اول: استفاده از بیگ‌‌دیتا میتواند نسبت به داده‌‌ها یا پروفایل‌‌هایی باشد که مبتنی بر اطلاعات حساس هستند مانند داده‌‌های مربوط به نژاد، شرایط پزشکی یا باورهای مذهبی. همچنین استفاده از بیگ‌‌دیتا میتواند ناظر به دسته‌‌بندی‌‌هایی باشد که به ظاهر بی‌‌طرف بوده امّا در حقیقت بر اساس این نوع داده‌‌ها (نژاد، مذهب و …) صورت میگیرد؛ رویه‌‌ای که به عنوان “تعیین خطوط قرمز”شناخته میشود.
نکته‌‌ی دوم: صرف نظر از اینکه اطلاعات حساس مورد استفاده قرار گرفته باشد یا خیر، عواقب استفاده از بیگ‌‌دیتا در بخش خصوصی نیز میتواند اساسی و مهم باشد.وقتی بیگ دیتا برای توسعه‌‌ی پروفایل‌‌های ریسک به کار میرود تا افراد واجدشرایط برای دریافت وام تعیین شوند یا وقتی بیمه‌‌های سلامت تصمیم میگیرند که چه افرادی را و تحت چه شرایطی بیمه کنند، عواقب استفاده از بیگ دیتا مهم خواهد بود.عواملی که هنگام وضع قانون در مورد بیگ دیتا باید مدنظر قرار گیرند عبارتند از: تأثیر استفاده از بیگ دیتا بر افراد، انواع داده و تحلیل داده‌‌هایی که مورد استفاده قرار گرفته، و خطر بروز اشتباه در تطبیق پروفایل های عمومی با افراد حقیقی.همچنین میتوان بین سازمانی که از بیگ دیتا استفاده میکند و هدف خاصی که بیگ دیتا برای آن مورد استفاده قرار میگیرد تمایز قائل شد.

د) فرصتهای پیش روی بیگ دیتا چیست؟
بیگ دیتا هم شامل ریسک‌‌ها و خطرات و هم شامل فرصتهایی است. برای مثال در سال ۲۰۱۳ هیئت مشاوره‌‌ی نخست وزیر فرانسه درباره‌‌ی مزایا و معایب بیگ دیتا تحقیق کرد. نتیجه آن بود که بیگ دیتا دانش و فرصتهای باارزشی را فراهم میکند ولی در عین حال در مورد حریم خصوصی و محرمانگی (Confidentiality) مشکلاتی را ایجاد مینماید.در هر صورت بیگ دیتا را باید یک تکنولوژی حیاتی دانست زیرا میتواند برای هر بخش از اقتصاد فرصتهایی را فراهم کند که در کل موجب کارآمد شدن دولت میشود.

فرصتهایی که بیگ دیتا فراهم میکند بطور خلاصه عبارتند از:
اول: افزایش خدمت به شهروندان و ایجاد شفافیت بیشتر در امور بخش خصوصی و بخش دولتی و اعطای قدرت نظارت بیشتر به شهروندان؛
دوم: رشد قابل ملاحظه‌‌ی شرکتها و استارت آپ ها، ایجاد اشتغال و کسب سود بیشتر توسط شرکتها در بخش خصوصی؛
برای مثال طبق گزارش کمیته‌‌ی دائمی صنعت نوین در فرانسه، فعالیتهای مرتبط به بیگ دیتا ۱۳۷ هزار شغل را ایجاد کرده است.
سوم: کمک به سازمانها، مؤسسات و وزاتخانه‌‌های دولتی در رسیدن به اهدافشان کرد.

ه) مسائل حقوق در داده های بزرگ
لازم به ذکر است که پدیده ای همچون بیگ دیتا نیازمند توسعه ی ابزار و فناوریهای لازم برای نمایش بصری این داده ها، مدیریت، پردازش، سازماندهی و استفاده ی بهینه از آنهاست که در مقالات متعدد فنّی مورد بررسی قرار گرفته است. اما یکی از مسائل مهم در خصوص بیگ دیتا جنبه های حقوقی آن است که کمتر بدان پرداخته شده است. بیگ دیتا حاوی اطلاعات باارزشی است که نیازمند حفاظت و حمایت است و راهکارهای حقوقی مناسب میتواند برای تأمین امنیت این داده ها مورد استفاده قرار گیرد. در ادامه به طور مختصر و خلاصه به مسائل حقوقی بیگ دیتا اشاره میشود.
حمایت و حفاظت از بیگ دیتا موجب ارتباط آن با سه شاخه از حقوق شده است:
حقوق مالکیت فکری
حقوق قراردادها
حقوق بشر (حفظ حریم خصوصی)

و) حقوق مالکیت فکری
در این قسمت، به این مسأله میپردازیم که حقوق مالکیت فکری چگونه از بیگ دیتا حمایت میکند:
پتنت:
به طور کلّی داده به عنوان پتنت قابل ثبت نیست. به نظر میرسد روشهای پردازش داده‌‌ها و تحلیل داده ها نیز تحت عنوان قواعد و فرمول‌‌های ریاضی بوده و از این رو به عنوان پتنت قابل ثبت نیستند. علاوه بر این، داده‌‌ها به طور مداوم در حال پیشرفت و پویایی هستند و این پویایی توسط پتنت قابل حمایت نیست. البته پتنت و بیگ دیتا از جهت دیگری نیز با یکدیگر مرتبط هستند و آن اظهارنامه‌‌های پتنت است. از آنجا که در اظهارنامه‌‌های پتنت، ویژگی های اختراع و شیوه‌‌ی تولید آن افشا میشود، خود این اظهارنامه‌‌ها میتوانند منبعی مفید از اطلاعات بوده و خود منبعی از داده های عظیم باشند. با این وجود، حمایت و حفاظت از اطلاعات موجود در این اظهارنامه‌‌ها تحت عنوان پتنت قابل حمایت نیست.
کپی رایت:
داده ها به خودی خود به عنوان اثر ادبی قابل ثبت نبوده و مشمول کپی رایت نیستند. امّا اگر گردآوری و همگردانی داده ها (Data compilation) به صورت اثری ادبی ابراز شود از حمایت کپی رایت برخوردار خواهد شد. پایگاه های داده نیز از حمایت کپی رایت برخوردار هستند. ولیکن حمایت کپی رایت از پایگاه های داده حمایت جامع و کاملی نیست. زیرا حمایت کپی رایت ناظر به شکل اثر است نه محتوای آن. از این رو محتوای پایگاه های داده از تعرض مصون نخواهد بود.
سرّ تجاری:
داده ها، همگردانی داده ها، و روش های پردازش، تحلیل و سازماندهی داده ها به دلیل داشتن ارزش اقتصادی و همچنین محرمانه بودن، مشمول عنوان سر تجاری بوده و قابل حمایت تحت این عنوان هستند. به طور کلّی، سر تجاری بهترین ابزار برای حمایت و حفاظت از داده هاست.
حقوق قرارداد ها:
علاوه بر موارد فوق که به حقوق مالکیت فکری مرتبط است، حقوق قراردادها نیز میتواند در حفاظت از بیگ دیتا مؤثر واقع شود. قراردادهای محرمانگی که بین دو طرف منعقد میشود الزاماتی را برای حفاظت از بیگ دیتا تعیین کرده و ضمانت اجراهایی را نیز برای نقض تعیین کرده است.
علاوه بر این با انعقاد قرارداد لیسانس میتوان دسترسی اشخاص ثالث به بیگ دیتا را به صورت کنترل شده و تحت الزامات بخصوصی فراهم کرد. بدین ترتیب هم امکان سرمایه گذاری اشخاص ثالث در بیگ دیتا فراهم میشود و هم داده ها تحت حفاظت خواهند بود.
قراردادهای لیسانس باید در خصوص مسائل اساسی و مهمی تعیین تکلیف کنند. از جمله:
چگونگی استفاده از داده ها
چگونگی انتشار داده ها
چگونگی ترکیب داده ها با داده هایی دیگر
چگونگی استفاده از داده های به دست آمده از ترکیب داده های پیشین با هم

ز) حقوق بشر (حفظ حریم خصوصی)
خطر بیگ دیتا از حریم شخصی (Privacy) شروع می شود. حریم خصوصی افراد نیز از جمله مسائلی است که به دلیل ارتباط تنگاتنگ آن با بیگ دیتا، پای حقوق بشر را به مسائل حقوقی بیگ دیتا باز میکند.
از آنجا که بیگ دیتا شامل انواع مختلف و عظیم داده هاست که معمولا میتواند اطلاعات شخصی افراد را نیز در بر بگیرد، حفظ حریم خصوصی افراد و وضع قوانین مناسبی که از حقوق افراد حمایتهای لازم را به عمل آورد ضروری مینماید.
در قوانین داخلی کشورها (قوانین موضوعه و قانون اساسی) و همچنین میثاق بین المللی حقوق مدنی و سیاسی از حریم خصوصی افراد حمایت شده است. به علاوه بیشتر وب سایت ها، خدمات آنلاین و اپلیکیشن های موبایل توافقنامه حفظ حریم شخصی دارند که شرایط استفاده توافقنامه کاربران نامیده می شوند که این کاربران این توافقنامه را با کلیک کردن یا با ادامه استفاده قبول می کنند. به نظر میرسد میتوان به منظور حفظ اطلاعات افراد در بیگ دیتا به قواعد سنتی پیشین استناد کرد مگر اینکه مسائل جدیدتری مطرح شود که نیاز به قانونگذاری جدید داشته باشد.
از طرفی آنچه اهمیت دارد به حداقل رساندن میزان اطلاعاتی است که جمع آوری میشود به عبارت دیگر میزان اطلاعات جمع آوری شده در هر مورد نباید بیش از اهدافی باشد که آن اطلاعات برای آنها جمع آوری شده است. ضمن اینکه اطلاعات شخصی باید به محض تحقق هدفی که اطلاعات برای آن گردآوری شده است، پاک شوند. اگرچه داشتن خط مشی حریم خصوصی رویه خوبی است اما در قانون نیز باید به لزوم رعایت حریم خصوصی خصوصا در جمع آوری و استفاده و به اشتراک گذاری اطلاعات شخصی اشاره شود و به صورت دوره ای نیز مورد بازنگری قرار گیرد.
برگرفته از:
What does big data mean for intellectual property protection? available at:
http://www.techpolicy.com/WhatDoesBigDataMean-IP-Protection.aspx , last visited: 28/05/2018
Trade secret protection and big data: an Italian view, available at: https://talkingtech.cliffordchance.com/en/ip/trade-secret-s-protection-and-big-data-an-italian-view.html, Last visited: 25/05/2018
مهدی فقیهی، مریم جلیلیان، بررسی الزامات حقوقی و قانونی بهره گیری از داده¬های عظیم با تأکید بر حفاظت از داده¬ها و الزامات قراردادی داده¬ها، مندرج در: ictssbigdata.itrc.ac.ir/data/cnf1408187944/uploads/present/Faghihi.pptx