زبان برنامه نویسی R تاریخ بروزرسانی : 09 مهر 1399 | تعداد بازدید : 403 | زمان خواندن مقاله : 15دقیقه

زبان برنامه نویسی R، یک پدیده عجیب در یادگیری ماشین

بچه ها جلسه امروز درسمون متفاوت تر از همیشه هست. امروز می خواهم درباره زبان برنامه نویسی R باهاتون صحبت کنم. کسی درباره این زبان برنامه نویسی چیزی میدونه؟ استاد ما فقط میدونیم که یک زبان برنامه نویسی در حوزه داده های آماری هست. آفرین کاملا درسته. پس بریم سراغ بحث اصلیمون.

این زبان برای اولین بار توسط راس ایهاکا و رابرت جنتلمن در سال 1993 نوشته شد و در حال حاضر توسط گروهی از متخصصان علم آمار به نام "تیم هسته نرم‌افزار R" در حال توسعه و ساخت‌ است. نورمن نای (Norman Nie) پژوهشگر شناخته ‌شده‌ در حوزه‌ی تحقیقات پیمایشی که یکی از ابداع کننده های SPSS در اواخر دهه ۶۰ میلادی بود، درباره زبان برنامه نویسی R میگه: یکی از قدرتمند ترین و قابل انعطاف‌ ترین زبان برنامه‌نویسی آماری در جهان است. ایشون در حال حاضر مدیر عامل شرکت Revolution Analytics در پالو آلتو، مشغول به فعالیت در تولید و عرضه نسخه ‌ی تجاری برنامه‌های R است.


تعریف:

پس R یک زبان و محیط نرم‌افزاری برای محاسبات آماری و علم داده‌هاست که بر اساس زبان‌های اس و اسکیم پیاده‌سازی شده. این نرم افزار متن باز از نظر دستورات، شباهت زیادی به نرم‌افزار آماری S-PLUS داره؛ اما هر کدوم هسته های متفاوتی دارن که قابلیت های متفاوتی رو ارائه میدن.

R بیشتر زمینه هایی مثل تحلیل سری‌های زمانی، رگرسیون خطی و غیرخطی، آزمون فرض‌های کلاسیک، کدگذاری، خوشه‌بندی و … رو پوشش میده و برای اشکال گرافیکی و نمودارها، نرم افزاری قدرتمند است. در محیط آن کدهای سی (C)، سی پلاس پلاس (C++) و فورترن (Fortarn) قابلیت اتصال و فراخوانی موقع اجرای برنامه را دارد که کاربران خبره می‌توانند توسط کدهای سی، مستقیماً اشیا R را تغییر بدهند. یک نکته جالب دیگه درباره این زبان برنامه نویسی اینه که قابل به کارگیری در محاسبات ماتریسی است و در این زمینه، همپای نرم‌افزارهایی مثل اُکتاو و نسخهٔ تجاری آن یعنی متلب (MATLAB) است.

دلیل محبوبیت زبان برنامه نویسی R:

بچه ها فکر می کنید چرا این زبان محبوب شد؟ استاد به نظر من با توجه به صحبت هایی که تا الان گفتین اولین دلیل محبوبیتش ، رایگان بودنشه. بله کاملا درسته. از طرفی دیگه این نرم افزار قابل نصب بر روی انواع سیستم عامل هاست که مشکل بسیاری از کاربرا رو آسون کرده. البته اینم بدونید که نسخه های غیر متن باز هم داره که شامل نسخه مبتنی بر پردازش داده‌های کلان (Big data)، اینترپرایز (Enterprise) و همین‌طور نسخه Cloud مبتنی بر محاسبات ابری است.

دیگه درباره این زبان چه چیزی دوست دارید بدونید، به بحثمون ادامه بدیم یانه؟ استاد اگه میشه درباره کاربردها، محدودیت ها و اینکه اصلا در چه رشته هایی کاربرد داره صحبت کنید. پس بحثمونو ادامه میدیم.

کاربردهای مهم زبان برنامه نویسی R:

  1. حالا بریم سراغ کاربردها: 
  2. R هم زبان برنامه‌نویسی و هم یک محیط نرم‌افزاری برای محاسبات آماری و علم داده‌ها محسوب میشه.
  3. محدوده گسترده ای از تکنیک های آماری رو داره.
  4. داشتن بسته های نرم افزاری قدرتمند برای تجزیه و تحلیل نتایج آماری
  5. داشتن کتابخانه برای انجام عملیات داده کاوی مثل دسته‌بندی، خوشه‌بندی، تحلیل شبکه اجتماعی، یادگیری تقویتی و…
  6. داشتن کتابخانه‌های خاص برای انجام عملیات تحلیلی در زمینه‌های مختلف علمی
  7. توسعهٔ قابلیت‌های R، با اضافه شدن بسته‌هایی که کاربران خبره ایجاد میکنن
  8. داشتن محیط خط فرمان برای ورود و اجرای دستورات و همینطور قابل ‌استفاده برای کاربران نرم‌افزار S-Plus 
  9. داشتن امکانات ذخیره، بازیابی و دست‌کاری داده‌ها.

 

بیشتر بخوانید: ماشین لرنینگ چیست و چه کاربردهایی دارد؟cool

 

محدودیت‌های زبان برنامه نویسی R:

درباره محدودیت هایی که داره میتونم اشاره کنم به مواردی مثل:

  • برای استفاده و برنامه‌نویسی باید فرمان‌های آن را بیاموزید.
  • زبان R مفسری است و همون طور که میدونید یعنی برای اجرا ترجمه نمی‌شود و به ‌صورت فایل اجرایی (.exe*) در نمی‌آید.
  • برای پردازش تکنیک‌های تحلیلی و حجم داده‌ها محدود است؛ یعنی نباید از مقدار ۱۶ ترابایت بیشتر شود که میتونه در برخی از کاربردها یک محدودیت جدی باشه که در این شرایط استفاده از آن چندان مناسب نیست.
  • اینکه یک سیستم تجاری قوی از برنامه R پشتیبانی نمی کند.


 در چه رشته‌هایی کاربرد دارد؟

به طور کلی در تمام رشته‌های محاسباتی که به روش‌های آماری مربوط است. از رشته‌های علوم پایه گرفته تا رشته‌های مختلف پزشکی، فنی و غیره می تونه مورد استفاده قرار بگیره. یکسری از رشته‌ها که نرم‌افزار R در آن‌ها بسیار کاربرد داره: رشته بیوانفورماتیک یا زیست‌داده‌ ورزی است و دیگری دانش استفاده از علوم کامپیوتر و آمار و احتمالات در شاخه بیولوژی یا زیست‌شناسی مولکولی می‌باشه. 

به طور کلی رشته‌های زیر می‌تونن در تحلیل‌های آماری خود از R استفاده کنند:

  • آمار و احتمالات
  • آمار زیستی
  • زیست‌شناسی و شاخه‌های مرتبط
  • علوم پزشکی و داروسازی
  • بیوتکنولوژی
  • اپیدمیولوژی و علوم محیطی
  • بیوانفورماتیک
  • علوم کامپیوتر
  • فیزیک
  • شیمی 
  • آمار مکانیک
  • علوم روانشناسی و اجتماعی
  • مدیریت


پایان جلسه:

خب بچه ها در آخر صحبت های امروزمون درباره زبان برنامه نویسی R دو تا مطلب دیگه میگم و جلسه امروزمون رو به پایان میرسونم.

مورد اولی که میخوام بگم معرفی بعضی از نرم افزارهای مورد استفاده در زبان برنامه‌نویسی R هست.

  • JGR: یک ویرایشگر چند سکویی بر پایهٔ جاوا.
  • R Commander: یک رابط گرافیکی بر پایهٔ tcltk که قابلیت استفاده از منوها به جای نوشتن دستورات را دارد و برای کاربران مبتدی و آشنا با اس پلاس مناسب است. 
  • آراکسل: RExcel امکان استفاده از R و R Commander در برنامهٔ ماکروسافت اکسل را فراهم می‌کنه.
  • Rggobi: رابط برنامهٔ GGobi برای کشیدن داده‌های ماتریسی

مورد بعدی کتاب های آموزشی زبان برنامه نویسی R هست که به زبان های مختلف منتشر شده. به عنوان منابع اصلی یادگیری این زبان می‌توان به Hands-On Programming with R نوشته Garrett Grolemund و R for Data Science به نویسندگی Hadley Wickham & Garrett Grolemund اشاره کرد. البته منابع مختلفی نیز به زبان فارسی وجود داره که جزء گزینه‌های خوب برای آموزش است مثل کتاب آموزش زبان برنامه نویسی R به نویسندگی بهنام بابایی.

خب بچه ها امیدوارم که جلسه درسی امروز براتون جالب بوده باشه. خسته نباشین.



توضیحاتی در مورد نویسنده این مقاله :
مرضیه فتاحی مرضیه فتاحی

کارشناس کامپیوتر گرایش نرم افزار..... نویسندگی،تجربه ای انفرادی است یعنی به اشتراک گذاری.... این بخشی از ذات انسان است که بخواهد مسائل را به اشتراک بگذارد ازجمله:افکار،ایده ها،عقاید


نظر بدهید

نشانی ایمیل شما منتشر نخواهد شد .
برای ارسال نظر نیاز است وارد سایت شوید. در صورت نداشتن حساب کاربری عضو شوید.