در این پست سورس پیاده سازی و آماده سازی دیتاست KDD99 برای تزریق به الگوریتم های یادگیری ماشین را قرار داده ایم. یکی از مشکلات محققان در زمینه دیتاست ها چگونگی جستجو و تهیه آن است ولی مشکل اصلی پس از پیدا کردن دیتاست، نحوه استفاده و تزریق آن به الگوریتم ها است. بدین صورت که اکثر دیتاست ها یا مجموعه داه ها بصورت خام هستند و برای استفاده از آن ها بایستی پیش پردازش شوند. احتمالا در موارد بسیار زیادی داده ها در دیتاست ها دارای نوع متفاوتی باشند (رشته، عدد) که نحوه تبدیل آنها به فرمت مخصوص الگوریتم ها با ابعا گسترده دیتاست ها کاری طاقت فرسا است. مخصوصا اینکه برای مشاهده نتیجه پس از اجرای کد بایستی چندین ساعت منتظر ماند. در این پست در ادامه به تشریح دیتاست KDD99 پرداخته می شود و محصول آماده که در متلب نوشته شده ارائه می گردد.
درباره این سایت