--- dir: rtl --- <div dir="rtl"> # یادگیری ماشین مقدماتی ۱ </div> ## Elementary Machine Learning I | **مقطع** | کارشناسی | نوع درس | تخصصی اختیاری-نظری | | --------------:|:--------:| ----------------:| ----:| | **تعداد واحد** | ۳ | **تعداد ساعت** | ۴۸ | | **پیش‌نیاز** | رگرسیون ۱ | **هم‌نیاز** | - | | **حل تمرین** | دارد | **آموزش تکمیلی** | - | **اهداف کلی :** آشنایی با یادگیری آماری **اهداف ویژه:** یادگیری آماری، تابع برآوردگر، معاوضه بین دقت پیش بینی و تفسیرپذیری مدل، یادگیری با نظارت در مقابل یادگیری بدون نظارت، رگرسیون در مقابل طبقه بندی، ارزیابی دقت مدل، اندازه گیری کیفیت برازش، مبادله سوگیری-واریانس، رگرسیون خطی، رگرسیون خطی ساده، برآورد ضرایب، ارزیابی دقت برآورد ضرایب، ارزیابی دقت مدل، رگرسیون خطی چندگانه، برآورد ضرایب رگرسیون، مقایسه رگرسیون خطی با k- نزدیکترین همسایه، رگرسیون خطی چندگانه، شرایط تعامل، تبدیل های غیر خطی پیش بینی کننده ها، پیش بینی کننده های کیفی، مروری بر طبقه بندی، رگرسیون لجستیک، مدل لجستیک، برآورد ضرایب رگرسیون، رگرسیون لجستیک چندگانه، رگرسیون لجستیک چند جمله ای، مدل های مولد برای طبقه بندی، تجزیه و تحلیل تفکیک خطی، تجزیه و تحلیل تفکیک درجه دوم، بیز ناپخته، مقایسه روش های طبقه بندی، مدل های خطی تعمیم یافته، مثال واقعی برای رگرسیون خطی مانند داده‌های اشتراک دوچرخه، رگرسیون پواسون در داده های اشتراک دوچرخه، داده های بازار سهام، روش نمونه گیری مجدد، اعتبار سنجی متقابل، رویکرد مجموعه اعتبار سنجی، اعتبارسنجی متقابل، تعادل بین بایاس و واریانس، بوت استرپ، انتخاب و تنظیم مدل خطی، انتخاب زیر مجموعه، بهترین انتخاب زیر مجموعه، انتخاب گام به گام، انتخاب مدل بهینه، روش های انقباض، رگرسیون ریج، لاسو، انتخاب پارامتر تنظیم، روش های کاهش ابعاد، رگرسیون مؤلفه‌های اصلی، حداقل مربعات جزئی، ملاحظات در ابعاد بالا، داده های با ابعاد بالا، رگرسیون در ابعاد بالا، تفسیر نتایج در ابعاد بالا، روش های منظم سازی، فراتر از خطی بودن، رگرسیون چند جمله ای، توابع پایه، اسپلاین‌ها ، چند جمله ای های تکه ای، محدودیت ها و اسپلاین‌ها، نمایندگی پایه اسپلاین‌، انتخاب تعداد و مکان گره ها، مقایسه با رگرسیون چند جمله ای، هموارسازی اسپلاین، مروری بر هموارسازی اسپلاین ها، انتخاب پارامتر هموارسازی λ، رگرسیون محلی، مدل های جمعی تعمیم یافته، مدلهای جمعی تعمیم‌یافته برای مشکلات رگرسیون، مدلهای جمعی تعمیم‌یافته برای مسائل طبقه بندی، روش مبتنی بر درخت، اصول درختان تصمیم، درختان رگرسیون، درختان طبقه بندی، درختان در مقابل مدل های خطی، مزایا و معایب درختان، روش بگینگ (دسته‌بندی) ، جنگل تصادفی، بوستینگ (تقویت شده) و درختان رگرسیون جمعی بیزی. **راهبردهای تدریس و یادگیری متناسب با محتوا و هدف:** سخنرانی، در صورت نیاز شبیه‌سازی و محاسبات نرم‌افزاری، انجام تکلیف‌های محول شده توسط دانشجویان. پیشنهاد می‌شود به جای منابع متعدد، فقط از کتاب ISL زیر در دو درس یادگیری ماشین مقدماتی ۱ و ۲ استفاده شود. به این ترتیب دانشجویان این کتاب را به خوبی فراخواهند گرفت و آمادگی پیدا خواهند کرد که مطالب عمیق‌تر را در تحصیلات تکمیلی از کتاب ESL دنبال نمایند. **ملزومات، تجهیزات و امکانات مورد نیاز برای ارائه:** کلاس درس و آزمایشگاه مجهز **سر فصل یا رئوس مطالب:** معرفی داده کاوی و تحلیل داده‌ها. گرداوری داده‌ها. دیداری سازی داده‌ها. خوشه بندی داده‌ها. رده بندی داده‌ها. تشخیص الگو و پیش بینی. قواعد پیوند. کشف داده‌های نابه‌هنجار. کار با داده‌های واقعی. **فهرست منابع پیشنهادی:** 1. James, G., Witten, D., Hastie, T. and Tibshirani, R. (2021). An Introduction to Statistical Learning, with applications in R, 2Ed, Springer, New York. (برنامه‌های کتاب فوق به زبان پایتون موجودند و گویا مولفان قصد دارند نسخه‌ی جدیدی از کتاب با پایتون در سال ۲۰۲۳ منتشر نمایند)