جزوه روشنایی فنی
کاردانی برق دکتر کلهر گل محمدی محمدحسین فاتحی دکتر مهدی مظفری لقا کاردانی آقای کریم پور کارشناسی ارشد علیپیام نور حجرگشت محسن تقویفر کریم
“” : ً -“” ” /++ ، #، 
؛ : : –ً ()، () () ، ؛ ؛ از برنامه های معیوب و غیر معیوب، وجود یا عدم وجود خطا در یک کد را پیش بینی کنیم. از طرف دیگر، می توانیم هزینه توسعه نسخه جدید یک برنامه را بر اساس سابقه هزینه های نسخه های قبلی همان برنامه پیش بینی کنیم. در ساختن مدل، باید ساختن مدلی که داده های آموزشی را تعمیم می دهد را همراه با پیروی از اصل رایج تیغ Occam، مد نظر قرار داد و این مدل باید تا حد امکان ساده باشد تا داده های مجموعه آموزشی فعلی را توجیه کند. شکل A2.2 این موضوع را نشان می دهد. اگر مجموعه آموزشی فقط شامل دایره ها باشد، تیغ Occam مدل خطی را انتخاب می کند، اما با افزودن مثلث به مجموعه آموزشی، تیغ Occam می تواند منحنی سینوسی را انتخاب کند. بنابراین، کدام مدل مناسب است: خط مستقیم، منحنی سینوسی یا روشنایی فنی از منحنی هایی که هنوز ناشناخته اند؟
تصویر 2-A2
در مثال هواشناسی، سیستم سعی می کند تا نقاط مشترک و در عین حال تفاوت هایی را بین () () () () () ؟ ؟ ؟
ً ؛ : (). ً ً 
؛ چند طبقه ای نامیده می شود. اگر یک مورد بتواند به چند طبقه تقسیم شود، با مشکل طبقه بندی چند برچسبی مواجه خواهیم شد. در این حالت، اغلب عضویت یک مورد در شده مطابقت دارد. به طور مشابه، یک مشکل طبقه بندی می تواند به عنوان یک مشکل رگرسیون مطرح شود که در آن مقادیر خروجی پیش بینی شده با مجموعه ای از برچسب های طبقه مطابقت دارد. تکنیک های رایج مورد استفاده برای یادگیری تحت نظارت شامل رگرسیون خطی، رگرسیون لجستیک، تجزیه و تحلیل تفکیک خطی، درختان تصمیم گیری، نزدیکترین همسایه k و شبکه های عصبی است. تکنیک های رایج برای روش های یادگیری روشنایی فنی نظارت شامل شبکه های عصبی، خوشه بندی و کاهش ابعاد است. ما در این ضمیمه فقط نمونه کوچکی از این تکنیک ها را بررسی می کنیم.
درختان تصمیم گیری. یادگیری درخت تصمیم گیری یک تکنیک پیش بینی است که از مشاهدات مشتق از داده های موجود در شاخه های درخت، برای نتیجه گیری در مورد مقدار هدف موجود در برگ درخت استفاده می کند. بر اساس مقادیر متغیر ورودی، مجموعه ای از تصمیمات سلسله مراتبی اتخاذ می شود. مقدار متغیر خروجی با دنبال کردن درختی از ریشه تا برگ، بر اساس پاسخ به سؤالات مطرح شده در طول مسیر، یافت می شود. به طور کلی، درختان تصمیم گیری می توانند دوتایی یا غیر دوتایی باشند و سؤالات مطرح شده می توانند دلخواه باشند، به شرطی <≤ ً () = () ، = () ، = () <<<؟
-()، <≥ ، (- ) + (- ) ≅ -()، /ً بیشتر k، خطا بزرگتر می شود. برای مثال به شکل A2.4 مراجعه کنید: با 1 نزدیکترین همسایه، نقطه خاکستری به عنوان سیاه طبقه بندی می شود؛ و با 3 نزدیکترین همسایه، به عنوان نقطه سفید طبقه بندی می شود. و با 5 نزدیکترین همسایه نیز به عنوان سفید طبقه بندی می شود. هوانگ و همکارانش، استفاده از نزدیکترین همسایه برای توسعه یک رویکرد بهبود یافته برای داده های از دست رفته در زمینه کیفیت نرم افزار را توصیه می کنند. از دست دادن داده ها مشکلات زیادی را برای یادگیری ماشین ایجاد می کند. روش های زیادی برای برآورد () ()، ()
فهرست مطالب