چالش های کشور در تأمین سوخت اصلی توسعه هوش مصنوعی
به گزارش سرگرمی کامپیوتری، علم داده تلفیقی از دانش های متنوع شامل آمار، یادگیری ماشین، برنامه نویسی و تخصص های حوزه های کاربردی است و به قول متخصصان، ارزشمندترین دارایی های یک سازمان، بعد از نیروی انسانی، داده ها هستند. همینطور داده ها بعنوان «سوخت اصلی» سیستم های هوش مصنوعی و یادگیری ماشین عمل می کنند؛ چون که با استفاده از تحلیل های علم داده، مدلهای یادگیری ماشین بهبود می یابد و توانایی پیشبینی و تصمیم گیری این مدلها ارتقاء می یابد.
رامین عابدی اصل، تحلیگر و کارشناس هوش مصنوعی در گفتگو با ایسنا، داده ها را منبع گران بهایی دانست که شرکت ها و سازمان ها برای حفظ مزیت رقابتی و اتخاذ تصمیم های هوشمندانه خود احتیاج به تحلیل و استفاده بهینه از داده ها دارند، اظهار داشت: علم داده بعنوان یکی از برجسته ترین رشته های چندمنظوره، ابزارهای قدرتمندی در اختیار ما قرار می دهد تا از دریای وسیع داده ها، دانش و بینش استخراج نماییم و با پیشرفت های چشم گیر در حوزه هوش مصنوعی و یادگیری ماشین، علم داده به پلی میان فناوری و تصمیم گیری های استراتژیک تبدیل گشته است.
وی علم داده را تلفیقی از دانش های متنوع شامل آمار، یادگیری ماشین، برنامه نویسی و تخصص های حوزه های کاربردی دانست که به تحلیل داده های ساختاریافته و غیرساختاریافته کمک کرده، افزود: در حالیکه تحلیل داده بیشتر بر استفاده از روش های آماری جهت بررسی داده های گذشته متمرکز است، علم داده با رویکرد پیشبینی و مدل سازی پیشرفته به کشف الگوهای پنهان و ایجاد سیستم های هوشمند می پردازد. تفاوت اصلی علم داده با آمار در اینست که علم داده از ترکیبی گسترده تر از ابزارها و الگوریتم ها، همچون یادگیری ماشین و شبکه های عصبی، برای تحلیل حجم وسیعی از داده های متنوع استفاده می نماید.
عابدی اصل تصریح کرد: علم داده توانایی آنرا دارد که در بین انبوهی از داده ها، الگوها و روابط پنهان را شناسایی کند و این الگوها همان بینشی است که میتوان از داده ها استخراج کرد. این بینش بسته به نوع داده در حوزه های مختلف کاربرد دارد، از داده های هواشناسی گرفته تا تحلیل بازارهای مالی و بورس و.. و بدون شک، یکی از علومی که در آینده نیاز شدیدی به آن در بازار کار احساس خواهد شد، علم داده است. بعنوان مشاوره حوزه فناوری اطلاعات در چند سال قبل تعداد زیادی از دانشجویان را به این رشته هدایت کرده ام، می توانم بگویم که این حوزه هم در داخل ایران و هم در خارج از کشور بازار کار بسیار خوبی دارد. همچنین، این رشته می تواند ایده های بسیاری برای کسب وکارهای استارت آپی ایجاد نماید.
این تحلیلگر حوزه هوش مصنوعی با طرح این سؤال که چگونه علم داده به تصمیم گیری هوشمند در سازمان ها کمک می کند؟ تصریح کرد: به عقیده من، ارزشمندترین دارایی های یک سازمان، بعد از نیروی انسانی، داده های آن سازمان هستند و منظور من از داده ها تنها محتوای قابل ذخیره در بانکهای اطلاعاتی نیست، بلکه تمام ارزش ها و موجودیت های سازمان، از رفتار مشتریان گرفته تا نحوه تعامل کارمندان، می تواند بعنوان داده سازمان دسته بندی شود. دراین میان، علم داده به سازمان ها کمک می نماید تا از این داده ها برای تصمیم گیری استفاده کنند؛ تصمیماتی که دقیق تر و قابل اعتمادتر از روش های سنتی هستند.
وی افزود: برای نمونه، با استفاده از مدلهای پیشبینی و تحلیل داده های بزرگ، سازمان ها قادرند رفتار مشتریان را پیشبینی کرده، بازاریابی هدفمندتری انجام دهند و حتی هزینه های عملیاتی خویش را بهینه سازی کنند. علم داده با عرضه تحلیل های عمیق و شناسایی الگوهای پنهان، به سازمان ها این امکان را می دهد که آینده را با دقت بیشتری پیشبینی کرده و استراتژی های مؤثرتری پیاده سازی کنند.
ابزارها و روشهای فنی مورد نیاز در علم داده
عابدی اصل، انتخاب ابزار برای انواع مختلف پردازش ها را بسته به نوع و ساختار داده ها متفاوت دانست و اظهار داشت: با این وجود، به صورت کلی ابزارها و روشهای فنی متنوعی در علم داده به کار می روند که شامل زبان های برنامه نویسی مانند Python و R، کتابخانه های یادگیری ماشین همچون TensorFlow و Scikit-learn، و پلت فرم های کلان داده مانند Hadoop و Spark است. این ابزارها به متخصصان علم داده کمک می کنند تا داده های خام را پردازش کرده، مدلهای پیچیده بسازند و نتایج قابل تفسیر عرضه کنند. همچنین، ابزارهایی مانند Jupyter Notebook محیط مناسبی برای آزمایش و توسعه مدلهای علم داده فراهم می کنند، به صورتی که امکان ترکیب تحلیل های مختلف و تصویری سازی داده ها را بهبود می بخشند.
وی تاکید دارد: تمام چالش های این فناوری از ذخیره سازی و مدیریت داده ها تا پردازش آنها حول محور داده می چرخند و افزود: یکی از بزرگترین چالش ها، حجم عظیم داده ها است که احتیاج به ذخیره سازی و پردازش کارآمد دارد. علاوه بر حجم، تنوع داده ها از منابع مختلف، مانند داده های ساختاریافته و غیرساختاریافته، و همینطور سرعت تولید داده هم چالش های دیگری را به وجود می آورند و مدیریت این داده ها نیازمند زیرساخت های پیشرفته و مقیاس پذیر است. بعنوان مثال، استفاده از سیستم های توزیع شده و ذخیره سازی ابری می تواند به سازمان ها کمک نماید تا به صورت مؤثرتری به این چالش ها پاسخ دهند.
این کارشناس حوزه داده، افزود: همچنین، امنیت و حفظ حریم خصوصی داده ها هم به سبب حساسیت اطلاعات در خیلی از حوزه ها، چالش مهم دیگری است که سازمان ها باید با آن مواجه شوند. اطمینان از اینکه داده ها به صورت ایمن ذخیره و منتقل می گردند و در عین حال حریم خصوصی افراد حفظ می شود، از الزامات کلیدی در عصر دیجیتال است.
آینده علم داده چگونه خواهد بود؟
عابدی اصل اظهار داشت: شاید این تعریف که "دانش از داده به دست می آید" برای اغلب اشخاصی که در رشته های کامپیوتر تحصیل کرده اند، آشنا باشد. بله، دانش از داده به دست می آید و ازاین رو داده و علمی که مسئولیت پردازش داده را دارد، می تواند بسیار مهم باشد. ازاین رو با عنایت به رشد سریع حوزه های در رابطه با علم داده، آینده این رشته بسیار روشن به نظر می آید و پیشبینی می شود که نقش آن در تحولات فناوری افزایش یابد. همینطور با رشد هوش مصنوعی، اینترنت اشیاء و پردازش های ابری، علم داده به یک بخش جدایی ناپذیر از تحول دیجیتال تبدیل خواهد شد.
به قول وی کاربردهای علم داده در حوزه های پیشرفته تری مانند پزشکی شخصی سازی شده، خودرو های خودران و شهر های هوشمند به شکل گسترده تری به کار گرفته خواهند شد. علاوه بر این، علم داده با تشکیل مدلهای پیشبینی دقیق تر و سیستم های خودمختار، به تغییر فرآیندهای کسب و کار و بهینه سازی تصمیم گیری ها کمک شایانی خواهد نمود.
چه مهارت ها و تخصص هایی برای ورود به حوزه علم داده لازم است؟
این تحلیلگر حوزه هوش مصنوعی افزود: اشخاصی که توانایی تحلیل بالایی دارند می توانند در علم داده به افراد نخبه این رشته تبدیل شوند؛ چون که خوراک اصلی این رشته تحلیل و تحلیلگر بودن است، در کل برای ورود به علم داده، تسلط به زبان های برنامه نویسی مانند Python و R، آشنایی با الگوریتم های یادگیری ماشین و درک عمیق از ریاضیات و آمار ضروری می باشد. همچنین، مهارت های پردازش داده های بزرگ و کار با پایگاه های داده، به همراه توانایی تصویری سازی داده ها، از مهارت های کلیدی محسوب می شوند.
وی افزود: علاوه بر مهارت های فنی، توانایی تحلیل و بررسی کسب و کار و درک نیازهای مشتری هم خیلی مهم است. به روز بودن با ابزارهای جدید و یادگیری مداوم هم از خصوصیت های ضروری متخصصان این حوزه است.
علم داده چه نقشی در هوش مصنوعی و یادگیری ماشین دارد؟
عابدی با تکیه بر این که علم داده و هوش مصنوعی به صورت نزدیکی با هم در ارتباط هستند، اظهار نمود: داده ها بعنوان «سوخت اصلی» سیستم های هوش مصنوعی و یادگیری ماشین عمل می کنند. با استفاده از تحلیل های علم داده، مدلهای یادگیری ماشین بهبود می یابند و توانایی پیشبینی و تصمیم گیری این مدلها ارتقاء پیدا می کند. علم داده با استفاده از الگوریتم های یادگیری ماشین به تحلیل داده های پیچیده و بزرگ کمک کرده، هوش مصنوعی با استفاده از این مدلها به تصمیم گیری های خودکار می پردازد.
وی ادامه داد: به جهت اینکه یک مدل هوش مصنوعی توسعه یابد، باید توسط داده ها آموزش داده شود و داده هایی که برای آموزش این مدل نیاز هستند، باید توسط متخصصان علم داده جمع آوری و پالایش شوند. همچنین، بهترین الگوریتم برای اجرای مدل باید انتخاب گردد. در نهایت، یک سیستم مبتنی بر هوش مصنوعی با استفاده از این داده ها و الگوریتم به نتیجه و پاسخ خواهد رسید. ازاین رو مراحل علم داده به این شرح است:
جمع آوری داده: داده ها از منابع مختلف جمع آوری می شوند و شامل داده های ساختاریافته و غیرساختاریافته هستند.
پالایش و پیش پردازش داده: داده های جمع آوری شده باید پاک سازی و پردازش شوند تا کیفیت و دقت آنها افزایش یابد. این مرحله شامل حذف داده های نادرست، پر کردن داده های مفقود و تبدیل فرمت های داده است.
تحلیل اکتشافی داده (EDA): در این مرحله، داده ها بررسی و تحلیل می شوند تا الگوها و روابط موجود در آنها شناسایی شوند.
انتخاب ویژگی: انتخاب خصوصیت های مهم و تأثیرگذار بر روی مدل به بهبود دقت و کارآمدی آن کمک می نماید.
ساخت و آموزش مدل: الگوریتم های یادگیری ماشین، انتخاب و مدل ایجاد می شود. سپس مدل با استفاده از داده های آموزشی آموزش داده می شود.
ارزیابی مدل: مدل آموزش دیده با استفاده از داده های آزمون ارزیابی می شود تا دقت و قابلیت پیشبینی آن مشخص شود.
استقرار مدل: مدل نهایی در محیط عملیاتی مستقر می شود و آماده استفاده در فرآیندهای تصمیم گیری است.
نظارت و به روزرسانی: مدل به صورت مداوم نظارت و بروزرسانی می شود تا عملکرد آن حفظ شود و با تغییرات داده ها سازگار باشد.
وی خاطرنشان کرد: حدودا میتوان گفت علم داده در تمام صنایع قابل استفاده می باشد، همچون در حوزه های مالی، بهداشت و درمان، تجارت الکترونیک و حمل و نقل. در صنعت مالی، علم داده به تحلیل ریسک، پیشبینی بازار و کشف تقلب کمک می نماید. در حوزه بهداشت، از داده ها برای پیشبینی بیماری ها، تحلیل نتایج درمان و بهینه سازی عملیات بیمارستانی استفاده می شود. تجارت الکترونیک هم از علم داده برای تحلیل رفتار مشتری، سفارشی سازی پیشنهادات و بهبود تجربه کاربر بهره می برد. صنعت حمل و نقل از داده های بزرگ برای بهینه سازی مسیرها و مدیریت ترافیک استفاده می نماید و البته هر روز به دامنه این صنایع و کاربردهای آن افزوده می شود.
مدیریت مسائل اخلاقی در رابطه با علم داده
این تحلیلگر حوزه هوش مصنوعی، حفظ حریم خصوصی و عدالت الگوریتم ها را دو چالش مهم در علم داده عنوان نمود و اظهار داشت: به سبب حجم عظیم داده های شخصی که توسط شرکت ها جمع آوری می شود، حفظ حریم خصوصی افراد خیلی مهم است. همچنین، عدالت در الگوریتم ها به این معناست که مدلهای یادگیری ماشین باید از تبعیض جلوگیری نمایند و بر مبنای داده های مغرضانه تصمیم نگیرند. برای مدیریت این چالش ها، ضروری است که قوانین و مقررات سخت گیرانه تری وضع شود و شفافیت در فرایندهای علم داده افزایش یابد و البته نکته بسیار مهمی که وجود دارد، اینست که کشورها و شرکتهای پیشرو در زمینه علم داده و پردازش ها و آنهائی که داده های عظیم در اختیار دارند، نقش مهمی را در آینده این علم و مسیری که می تواند طی کند، خواهند داشت.
به نقل از ایشان، چالش های اصلی توسعه علم داده در ایران را میتوان در چندین حوزه کلیدی دسته بندی کرد که شامل زیرساخت های تکنولوژیک، منابع انسانی، فرهنگ سازمانی و چالش های قانونی و اخلاقی می شود. اما در کنار این چالش ها، فرصت های بسیار بزرگی هم وجود دارد که در صورت مدیریت صحیح، می توانند به تحول دیجیتال و بهبود تصمیم گیری هوشمند در سازمان های ایرانی منجر شوند. از دیگر چالش های علم داده در کشور میتوان به این موارد اشاره کرد:
۱. کمبود زیرساخت های تکنولوژیک
یکی از چالش های مهم در راه توسعه علم داده در ایران، ضعف زیرساخت های فناوری اطلاعات و ارتباطات (ICT) است. برای پردازش و مدیریت حجم عظیمی از داده ها، احتیاج به زیرساخت های پیشرفته ای همچون سرورها، سیستم های ابری و پلت فرم های ذخیره سازی داده بزرگ (Big Data) وجود دارد. در ایران، محدودیت های موجود در این حوزه، بخصوص در استفاده از خدمات ابری جهانی و محدودیت های پهنای باند، می تواند سرعت پیشرفت این حوزه را کند کند.
۲. کمبود نیروی انسانی متخصص
علم داده بعنوان یک رشته چندمنظوره نیازمند نیروی انسانی با تخصص های مختلف همچون برنامه نویسی، آمار، یادگیری ماشین و تحلیل کسب و کار است. در ایران، کمبود نیروی متخصص و نبود دوره های آموزشی پیشرفته و کاربردی یکی از موانع اصلی است. خیلی از دانشگاه ها هنوز برنامه های آموزشی مناسبی برای تربیت متخصصان علم داده ندارند و تنها به جنبه های تئوریک می پردازند.
۳. فرهنگ سازمانی و مقاومت در مقابل تغییر
یکی دیگر از چالش های بزرگ، عدم تمایل برخی سازمان ها به پذیرش فرهنگ داده محور است. خیلی از سازمان های کشور هنوز تصمیم گیری های خویش را بر مبنای تجربیات گذشته و روش های سنتی انجام می دهند و به جای استفاده از داده ها و مدلهای پیشبینی، به عوامل دیگری اعتماد می کنند.
۴. مسائل قانونی و اخلاقی
یکی از موضوعات حساس در علم داده، حفظ حریم خصوصی و امنیت داده ها است. با عنایت به این که خیلی از داده ها در ایران به شکل غیرساختاریافته و بدون نظارت دقیق جمع آوری می شوند، نگرانی های زیادی در مورد سوءاستفاده از داده ها و نقض حریم خصوصی افراد وجود دارد.
عابدی اصل تصریح کرد: در کل اگر بخواهیم یک جمع بندی داشته باشیم، علم داده بعنوان یکی از مهم ترین حوزه های فناوری در دنیای امروز، نقشی کلیدی در پیشرفت های فناوری و تصمیم گیری های هوشمند دارد. این حوزه با ترکیب تحلیل های پیچیده داده و ابزارهای پیشرفته، به سازمان ها کمک می نماید تا از داده های خود بهترین بهره را ببرند. آینده علم داده با عنایت به پیشرفت های هوش مصنوعی و یادگیری ماشین بسیار روشن است و انتظار می رود که تأثیر آن بر صنایع و زندگی روزمره ما بیشتر از گذشته شود.
منبع: pcfun.ir
این مطلب را می پسندید؟
(0)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب