بزرگراه به سوی آینده
بخش اول گفتوگو با خانم دکتر مریم حاجیپور صاحبنظر در حوزه ابر داده:
عبارت Big Data مدتها است که برای اشاره به حجم عظیمی از دادهها که توسط سازمانهای مختلف جمعآوری میشود، مورد استفاده قرار میگیرد.
به گزارش پایگاه خبری بانکداری الکترونیک، کارآمدن دولت دوازدهم و تاکید بر الکترونیکی کردن بخش اعظمی از خدمات دولت بر لزوم توجه جدی بر این حوزه میافزاید، این درحالی است که به نظر میرسد هنوز هم تعریف و شناخت مشخص و دقیقی از این حوزه ارائه نشده است. در همین راستا، پای صحبت یکی از کارشناسان و پژوهشگران علاقهمند به این حوزه نشستیم تا از شرایط حاکم بر بیگدیتاها در داخل کشور اطلاعات بیشتری کسب کنیم. به اعتقاد وی، بیگدیتا به عنوان یک نظام علمی جدید و بااهمیت در عصر امروز تلقی میشود و حضور در این نظام علمی جدید، مستلزم یادگیری علوم مختلف است. آنچه در ادامه میخوانیم بخشی از سخنان این صاحبنظر در حوزه ابر داده، در رابطه با موانع و دیدگاههای نادرستی است که بر این حوزه حاکم شده و ضرورت اصلاح نگرشها را میطلبد.
*چه تعریف دقیقی از حوزه خاص Big Data یا به تعبیر شما، ابر داده ارائه میکنید؟
ابر داده هم مثل هر فناوری، الفبایی دارد که از مباحث پایهای 5V شروع میشود. وظیفه من مفهومسازی، ملموسسازی و خطدهی در زمینههایی است که شما را به سمت سیاستگذاران این حوزه سوق دهد. وظیفه من به عنوان کسی که در این رشته تحصیل کردم و روی مواردی کارکردم که درگیر آن حوزه بوده، این است که عملیاتی، ساده و شفاف صحبت کنم و ملزومات تحولات اندیشهای را در سیاستگذاری علم و فناوری ترسیم کنم. طبیعی است که تیپهای مختلف ابر داده در هر حوزه وجود دارد که باید ارتباط تنگاتنگی بین متخصص در زمینه مدیریت فناوری اطلاعات، با متخصصین سایر حوزهها مثل حوزه اقتصادی یا مالی برقرار شود تا تعریفی شفاف از مسئله و بهتبع آن راهکاری دقیق رقم بخورد.
به طور خلاصه باید بگویم، در حوزه ابر داده، تمایلی به ارائه تعریف آن بهعنوان یک واژه پوششی برای هر مجموعه داده بسیار بزرگ و پیچیده ندارم. واقعیت این است که ازنظر آنتولوژی، ابر داده، واژه جدیدی نیست. درواقع واژه داده به ابر داده اصلاح شد که بیانگر چشمانداز بزرگ و پتانسیل تحول بخش در قسمتهای مختلف است. تفاوت در Epistemology یا معرفتشناختی اتفاق افتاده است. سال 90 که من از سونامی داده گفتم، درواقع اشاره به برخی از ویژگیهای ذاتی ابر داده بود که امروز از نزدیک آن را لمس میکنیم. بسط این مفهوم، تعاریف و ویژگیهای رایج آن، در حوزه اقتصادی و بانکی، در چابکی فرآیند و روند سیاستگذاری و مصورسازی پیچیدگیهای محیطهای سیاسی، خلاصه میشود. از خود مسئولین بانکمرکزی هم بپرسید، صراحتا خواهند گفت که داده تجمیعی برای سیاستگذاری کفایت نمیکند و سیاستگذاران به دادههای ریزتر و جزئیتری نیاز دارند. این به معنای تغییرات بنیادین در اهداف سیاستهای پولی نیست. و در اصل تمرکز، همچنان بر متغیرهای اقتصاد کلان است. فقط آنچه اتفاق میافتاد این است که دادههای خرد در ابتدا باعث بهبود درک افراد از مکانیسم انتقال سیاست پولی و بعد از آن، امکان درک بهتر از دادههای تجمیعی و پیشبینی دقیقتر نسبت به سیر تکاملی آنها میشود. اگر بخواهم در یک جمله بیان کنم، ابر داده پتانسیلی برای برآوردهای بهموقع توسعههای اجتماعی- اقتصادی است. ولی آنچه حائز اهمیت است این است که اولا به چه میزان ضرورت و اهمیت آن توسط سیاستگذاران واقعی، درک شده و دوما چه سیاستگذاری تاکنون در این زمینه انجامشده یا قرار است که انجام شود.
*در رابطه با دیدگاه Multi-Disciplinary بودن موضوعات ارتباط آن را با مبحث ابر داده چگونه میدانید؟
شما، بروز و ظهور این دیدگاه را در یک انقلاب علمی، تحت عنوان رشته علم داده شاهد هستید. علم داده بهعنوان یک نظام علمی نوظهور، بسیار ارزشمند است. متخصصین، دانشمندان یا به تعبیر بنده، حکیمان علم داده/ Data Scientists، تواناییهایی درزمینه شناسایی و تعیین ارتباطات دادهای بهکارگیری و از همه مهمتر ارزشآفرینی از داده را دارند. علم داده، ضرورتا درگیر چالشهای استخراج اطلاعات معنادار و ارزشمند از این داراییها خواهد بود. حضور در این نظام علمی جدید، مستلزم یادگیری علوم مختلف است که به همین دلیل ترجیح میدهم افراد متخصص در این زمینه را حکیمان علم داده خطاب کنم. این واژه را از حکیم عمر خیام، حکیم ابوعلی سینا و سایر مفاخر علمی برای مقایسهای نسبی استفاده میکنم تا شما به کنه وسعت دید علمی این افراد پی ببرید.
*ارتباط ابر داده باهوش مصنوعی چیست؟
ببینید، جایگاه و اهمیت ابر داده، در بحران مالی سال 2008 و گسترش بینالمللی آن در سال 2009 و پیامد آنکه رکود اقتصادی کشورها بود، مشخص شد. درواقع آن بحران، منجر به آشفتگی واقعی و عدم تعادل در اقتصاد شد بهنحویکه آمارها و اقتصاد سنتی را شدیدا به چالش کشید. یعنی نشان داد که تحلیلهای آماری نهتنها بسیار سنتی عمل کردند، بلکه توان پیشگویی و پیشبینی چنین بحرانی را نداشتند و سیاستگذاران و عاملان اقتصادی دچار نقص اطلاعاتی در ارزیابی بهموقع از وضعیت اقتصاد و تحولات مورد انتظار هستند. درواقع بیانگر این موضوع بود که تحلیلها بهشدت به دادههایی وابسته هستند که بهواسطه توسعه سریع شبکههای کامپیوتری و اینترنت، باعث ایجاد منابع جدیدی از اطلاعات و دادههای دیجیتالی شدهاند که ناشی از تراکنشهای کسبوکار، مدیاهای اجتماعی و مهمتر از همه پرداختهای الکترونیکی بهویژه تراکنشهای کارتهای اعتباری است.
از طرف دیگر، مقارن بودن با پیشرفتهای فناورانه، فرصتهای بهرهبرداری از این دادههای دیجیتالی را مهیا کرد. ترکیب این موارد، ابر داده را تشکیل داد، پس ابر داده موضوع عجینشده با تحلیلهای پیشگویانه و پیشبینانه است. البته خود این موضوع چالشهایی فراتر از چالشهای فنی و مباحث سختافزاری و نرمافزاری را یدک کشید. بهعنوانمثال مهارتها، مباحث آماری، معماری الگوریتمها، حتی خود ابر داده که در لحظه تغییر و تحول پیدا میکند. بنابراین روشهایی باید بهکار گرفته شود که توانایی احصاء این پویاییها را داشته باشد. درحال حاضر، ابر داده در آغاز ورود به یک مرحله جدید از بلوغ است.
خیلی زود به دلیل تاثیرات شدیدش بر کسبوکار، شاهد ساختارشکنی صنعتی خواهیم بود. علت هم این است که سازمانهای پیشرو، برای چابکی در ارائه ارزش، به دنبال ترکیب چابکی در پردازش ابر داده با معیار قابلیتهای هوش مصنوعی هستند. به همین دلیل همگرایی ابر داده با هوش مصنوعی بهعنوان مهمترین تحولی است که اخیرا پدیدار شده است. حقیقتا هم، مدیریت داده و قابلیتهای تحلیلی است که نقش آیندهنگاری را برای بنگاهها ایفا میکند. ساده بگویم، میدانید دقیقا دارد چه اتفاقی میافتاد؟ اینکه سازمانها متحمل شکستهایی اینچنینی میشوند، بدیهی است ولی همگرایی ابر داده با هوش مصنوعی، به دلیل اینکه امکان دسترسی به دادههای برخط را فراهم میکند، باعث میشود تا تحلیلهای Real-Timeای اتفاق بیافتد که وقتی سازمانها با شکست مواجه میشوند، سریعتر بیاموزند و سریعتر اقدامات اصلاحی را انجام بدهند.
یعنی نگاه پیشبینانه، پیشگویانه و پیشگیرانه، مفهوم دقیقتری به خود بگیرد. این همگرایی منجر به منسوخ شدن استفاده از مفاهیم سنتی آمار در حوزه ابر داده شده است. یعنی دیگر آمار سنتی پاسخگوی تحلیلهای ابر دادهای نیست. به همن دلیل است میگویم ابر داده و تحلیلهای ابر دادهای، فناوری و فناوریهای ساختارشکن هستند.
*سازمانها چه زیرساختی را برای ورود به این مقوله نیاز دارند؟
به نظر من، از نظر مدیریتی، وجود دو زیرساخت در سازمان حیاتی است. اول، استراتژی مدیریت تغییر برای یک انتقال نرم و دوم، آموزش همه ذینفعان و تصمیمگیرندگان با آگاهیبخشی از تواناییها و ناتواناییهای حوزه تحلیل ابر داده و بهویژه توصیف چالشهای کلیدی که وجود خواهد داشت. از نظر من این دو زیرساخت خیلی مهم هستند چون تصور مدیریتها نسبت به ابر داده اگر تنها به معنای توانایی پردازش و مدیریت حجم زیادی از داده، باشد، تصور محکوم به شکست است. باید به این درجه از شناخت برسند که آزادسازی پتانسیل دانشی، هدف است که تحقق آن، از طریق یکپارچگی منابع مختلفی از دادههای ساختیافته و ساختنیافته، جدید و قدیم، کوچک و بزرگ، محیطی و رفتاری، امکانپذیر است.
*واقعا با این حجم از داده، با این همه تنوع و با چنین سرعت بالایی در تولید، باید چه کرد؟ صرفنظر از مباحث سیاستگذاری، اولین گام جدی چیست؟
از نگاه فنی و سپس اثرات دوسویه آن در سیاستگذاری، داده درمانی اولین گام است.
*منظور شما از دادهدرمانی چیست؟
بله Data Treatment. همیشه وقتی واژه درمان یا Treatment شنیده میشود، ناخودآگاه حوزه سلامت به ذهن خطور میکند. درحالیکه اگر کلمه درمان را بر سر هر حوزهای مثل اقتصاد، فرهنگ و غیره بگذاریم، بهراحتی واژههای اقتصاددرمانی، فرهنگدرمانی، حتی تفکردرمانی در حوزه اجتماعی را خواهیم داشت که دقیقا پیامد آن سلامت در حوزه یعنی سلامت اقتصادی، سلامت فرهنگی، سلامت فکر مورد بحث است. به دلیل نیاز ذاتی هر حوزهای به داده، برای ترسیم شرایط واقعی، تحلیل موقعیت، ترسیم شرایط مطلوب و حتی ارزیابی اثرات تصمیمات گرفتهشده، باید مشخص شود با این همه دادهای که جمعآوریشده چه نوع کاری میخواهید انجام دهید. تکنیکهای مختلفی برای دادهدرمانی با حضور هوش مصنوعی فراهم شده که دادهدرمانیهای آماری را بهنوعی پشت سر گذاشته است. اما میخواهم از این فرصت استفاده کنم و بگویم یکی از مهمترین دستاوردهای پنهان و ناملموس دادهدرمانی، اشتغالزایی است. بهطور کلی، ابر داده و تحلیلهای پیشگویانه، بهشدت اقتصاد را در مهمترین شاخصهای کلان اقتصادی متحول خواهد کرد.
*یعنی شما معتقد هستید که ابر داده حلال مشکلات خواهد بود؟
پاسخ بهشرط نگاه واقعبینانه یک بله با قاطعیت است.
*چه نوع واقعبینی؟
در مبحث محدودیتها توجه به تنگناها و محدودیتها در اکوسیستم ابر داده باید، میزان دسترسپذیری اطلاعات، مالکیت داده، محرمانگی داده و هزینهها و سرمایهگذاریهای لازم در حوزه زیرساختی ابر داده، مورد توجه قرار بگیرد. اما مهمترین محدودیت مربوط به توزیع قدرت بین بازیگران خاص این اکوسیستم، که نامتناسب خواهد بود، میشود.
*توزیع قدرت؟
بله، دقیقا. مجبور هستم برای باز کردن این موضوع، به یکی از مهمترین مباحث مطرح که عجین در فناوریهای نوین است، اشاره کنم. مبحث اقتصاد اطلاعات یا Information Economics که به نقش اطلاعات به لحاظ اقتصادی میپردازد که به عنوان مبحثی بسیار جذاب و نسبتا جدید در حوزه اقتصادی و فناوری اطلاعات و با همان ویژگیهای ذاتی میانرشتهای است. اینکه بیان کردم توزیع نامناسب قدرت، بهنوعی هم به لحاظ کمی و هم به لحاظ کیفی به موضوع Asymmetry یا عدم تقارن یا نابرابری اطلاعاتی در این مبحث مربوط میشود. یعنی با بازاری مواجه هستیم که توازن اطلاعاتی در نقطه تعادل قرار ندارد. این امر منجر به رانت اطلاعاتی میشود که این رانت، یا بحث قدرت چانهزنی یا Bargaining Power را برای ذینفعان به همراه خواهد داشت یا در بیشتر مواقع، متاسفانه باعث رفتارهای فرصتطلبانه یا Opportunistic Behavior میشود که در مبحث اقتصاد اطلاعات منجر به دو عارضه کژگزینی یا انتخاب بد/ Inverse Selection و کژمنشی یا مخاطره اخلاقی/ Moral Hazard میشود. شک نکنید که در دیدگاه مدیریت فناوریمحور، نتیجه این رفتار فرصتطلبانه، خروج نیروی کار خوب از بازار میشود. چون این رویکرد، داراییمحور نیست. نمیخواهم وارد این مبحث گسترده و علل ایجاد این پدیده یا راهکارهای موجود برای آن باشم. فقط میخواهم عنوان کنم که سیاستگذاران در زمان سیاستگذاری باید این محدودیت را در نظر بگیرند چون مخاطرات زیادی را به همراه خواهد داشت.
ادامه دارد …
منبع: ماهنامه بانکداری آینده شماره 25 مهر 96