ویژگی های فیزیکی ای که در تقطیر بنزین موتور بایتس مورد اندازه …

پایان نامه های سری بیستم

در یک عملیات آموزش جهت ورود به شبکهی عصبی، بانکداده بر اساس دو روش کلی به دو یا سه قسمت مجزا تقسیم می گردد.
در یک روش دادهها به دو قسمت مجزا با نامهای ذیل تقسیم می شوند:
مجموعه دادههای آموزش[۸۱]
مجموعه دادههای آزمایش[۸۲]
در روش دیگر دادهها به شکل سه بخش جداگانه با عناوین زیر به شبکهعصبی ارائه می شوند:
مجموعه دادههای آموزش
مجموعه دادههای ارزیابی[۸۳]
مجموعه داده های آزمایش
در هر دو روش، مرحله یادگیری جهت توسعه دادن شبکهی مورد نظر بهکار رفته است. در این عملیات (وابسته به روشی که مورد استفاده است) خروجی مطلوب در سری یادگیری جهت کمک به شبکه به کار میرود تا وزنهای بین نرونها یا واحدهای پردازشگر را تطبیق و سازگار نماید. در روش اول، مجموعه دادههای آزمایش جهت آزمایش و تعیین کارآمدی مدل ایجاد شده به شبکه ارائه میشوند. در روش دوم مجموعه دادههای ارزیابی در حین اجرای مرحله آموزش و جهت دستیابی به یک مدل بهینه در پیشبینی دادههای جدید به کار رفته و پس از اتمام مرحله آموزش و یافتن مدل نهایی، مجموعه دادههای آزمایش به منظور تأیید و تصدیق کارآیی و دقت مدل، مورد استفاده قرار میگیرند. در این مطالعه از روش دوم جهت ارائه دادهها به شبکه استفاده گردیده است. بنابراین در مطالب آینده در مورد تقسیم بندی بانک داده بر این رویه تأکید گشته و مطالب مربوط بر اساس این روش تنظیم و ارائه می شوند.
۴-۶٫ تعیین نسبت تعداد دادهها در فازهای مختلف
نحوهی تقسیمبندی دادهها باید به نحوی باشد که هر گروه نماینده واقعی کل دادهها باشد و به عبارتی دیگر نمونهای مبین از جامعه آماری مورد مطالعه باشد. تعیین تعداد نمونهها جهت آموزش و کنترل کارایی شبکه باید بهدقت انجام گیرد تا بهدرستی از کارایی شبکه و آموزش مناسب آن اطمینان حاصل گردد. معمولاً در تقسیمبندی مجموعه دادههای مسأله جهت رسیدن به پاسخ قابل قبول باید تعداد دادههای مورد استفاده در فاز آموزش از تعداد دادههای مربوط به فازهای ارزیابی و آزمایش بیشتر باشند. همچنین باید تا حد امکان تقسیم مجموعه کلی دادهها به زیر مجموعه کلی دادهها به صورت تصادفی صورت گیرد. در این راستا عقیده متخصصان دادهکاوی بر این است که در تقسیم بندی سری نوع اول ، ۲۰ تا ۲۵ درصد کل دادهها میتواند برای ارزیابی و آزمایش مدل توسعه یافته استفاده گردد. بدین ترتیب معمولاً بهتر است که در آموزش همه مدل های دلخواه ۷۵ تا ۸۰ درصد کل دادهها به صورت مجموعه دادههای آموزشی به کار برده و آنگاه دادههای مستقل باقیمانده برای ارزیابی مدل استفاده شوند [۲۳]. در تقسیم بندی سری دوم، یعنی تقسیم مجموعه دادهها به سه قسمت دادهها معمولاً به نسبت ۶۰، ۲۰ و ۲۰ درصد تقسیم میگردند. یعنی ۶۰ درصد دادهها برای مرحلهی آموزش، ۲۰ درصد برای ارزیابی شبکه هنگام آموزش و ۲۰ درصد باقیمانده جهت آزمایش و تأیید آماری شبکه مورد استفاده قرار میگیرند[۲۳].
انتخاب تصادفی دادهها در فازهای مختلف باید به گونهای صورت گیرد که در فاز آزمایش و ارزیابی شبکه، دادههای مورد آزمایش به جای عمل درونیابی در خارج از محدوده آموزشی مورد برونیابی قرار نگیرند. به عبارت دیگر بهتر است داده های آموزشی به نحوی انتخاب گردند که تمام نقاط مرزی و نقاطی که در آنها خاصیت مورد بررسی دچار تغییرات شدیدی میگردد را در بر بگیرد. دو نکته بسیار مهم در مورد انتخاب دادههای آزمایش باید رعایت گردد؛ اولاً این قسمت از دادهها نباید قبلاً در مرحله آموزش مدل پیشنهادی به کار رفته باشند. ثانیاً محدودهی تغییرات این سری از دادهها به صورت اصولی حتماً بایستی در بازه دادههای مرحله آموزش شبکه قرار بگیرد. به این معنی که تمام دادههای مجموعه آزمایش باید بین مقادیر حداقل و حداکثر دادههای مجموعه آموزش قرار گیرند.
جداول زیر مشخصات ورودی ها و خروجی های شبکه را در مراحل آموزش، ارزیابی و آزمایش نشان می دهند.
با تقسیم بندی بانک داده‌ای برای سری دادههای موجود بصورت زیر با انتخاب رندوم تشکیل میگردند:
۴۰۳ داده آموزشی (۷۰% کل دادهها)
۸۷ داده ارزیابی (۱۵% کل دادهها)
۸۷ داده آزمون (۱۵% کل دادهها)
جدول(۴-۳): مشخصات ورودیها و خروجیهای شبکه در مرحله آموزش(۴۰۳ سری داده)

پارامتر پارمترهای ورودی پارامتر خروجی
FBP (°C ) ۹۰% ۵۰% ۱۰% IBP (°C) RON
میانگین ۱۸۲٫۰۱۲۴ ۱۵۰٫۱۸۸۶ ۱۰۲٫۸۷۳۴ ۶۳٫۹۷۵۲ ۳۹٫۶۸۹۸ ۸۶٫۴۱۴۴
برای دانلود متن کامل پایان نامه به سایت  jemo.ir  مراجعه نمایید.