جستجو برای:
  • صفحه اصلی
  • فروشگاه
  • مجله علمی گیلادمیا
  • درباره ما
  • تماس با ما
  • دعوت به همکاری
 
گیلادمیا | مدرسه علوم کامپیوتر
دوره‌های آموزشی
  • هوش مصنوعی
  • متلب
  • علوم داده
0

ورود و ثبت نام

  • صفحه اصلی
  • فروشگاه
  • مجله علمی گیلادمیا
  • درباره ما
  • تماس با ما
  • دعوت به همکاری

دوره آموزشی Data Cleaning در Kaggle با استفاده از زبان برنامه نویسی پایتون

خانهعلوم دادهدوره آموزشی Data Cleaning در Kaggle با استفاده از زبان برنامه نویسی پایتون
http://dl.gilademia.com/courses/G0108521546/G0108-Intro.mp4
حالت مطالعه

چرا این دوره برای شما مفیده؟

تمیز کردن داده ها بخش مهمی از علم داده است. چرا برخی از فیلدهای متنی شما دچار مشکل شده اند؟ در مورد  مقادیر از دست رفته (Missing  Values) چه باید کرد؟ چرا تاریخ های شما به درستی قالب بندی نشده اند؟ چگونه می توانید به سرعت داده های ناسازگار را پاک کنید؟ در این دوره ، خواهید آموخت که چرا با این مشکلات روبرو شده اید و مهم تر اینکه چگونه آنها را برطرف کنید!

در این دوره ، نحوه برخورد با برخی از رایج ترین مشکلات تمیز کردن داده ها را خواهید آموخت تا بتوانید سریعتر به تجزیه و تحلیل داده های خود بپردازید. شما می توانید پنج تمرین عملی را با داده های واقعی و به هم ریخته انجام دهید و به برخی از سوالات متداول خود در مورد پاکسازی داده ها پاسخ دهید.

سرفصل‌های دوره

بخش اول : مدیریت مقادیر از دست رفته (Handling Missing Values)

نگاه اجمالی به داده ها 

چه تعداد مقادیر از دست رفته در داده ها وجود دارد

بررسی دلایل از دست دادن داده ها 

حذف موجودیت های که حاوی مقایر از دست رفته هستند

پرکردن مقادیر از دست رفته

تمرین های مربوط به هر بخش 

بخش دوم : مقیاس گذاری و نرمال سازی (Scaling and Normalization)

تفاوت مقیاس گذاری و نرمال سازی با مثال 

مقیاس گذاری با مثال  

نرمال سازی با مثال

تمرین های مربوط به هر بخش

تمرین های مربوط به هر بخش

بخش سوم : تجزیه تاریخ (Parsing Dates)

چک کردن نوع داده مربوط به ستون حاوی تاریخ

تبدیل داده های مربوط به ستون تاریخ به نوع شئ داده ای datetime در پایتون

انتخاب داده ها به صورت روزانه

مصورسازی داده ها به صورت روزانه برای بررسی درستی آنها

تمرین های مربط به هر بخش

بخش چهارم : کدگذاری کاراکترها (Character Encodings)

کدگذاری  داده ها چیست

انواع سیستم های کدگذاری داده ها

خواندن فایل هایی که مشکلات کدگذاری دارند

ذخیره سازی فایل ها با سیستم کدگذاری UTF-8

تمرین های مربوط به هر بخش

بخش پنجم : ورود داده های ناسازگار (Inconsistent Data Entry)

چند پیش پردازش اولیه روی متن ها را انجام میدهیم

ااز متد fuzzy matching برای اصلاح داده های ناسازگار استفاده می کنیم

تمرین های مربوط به هر بخش

توضیحات بیشتر

تمام کدهای لازم از قبل نوشته شده هستند و  به این  دلیل در زمان ویدیوها صرفه  جویی شده و شما می تونید از اون ها در کارها و پروژه های خودتون استفاده کنید و همونجا آزمون و خطا انجام بدید روی کدهایی که وجود داره برای فهم بیشتر

ابزارهای مرتبط

برای دوره پیشنهادی کافی است  وارد سایت Kaggle شوید. تمام ابزار های مورد نیاز داخل سایت به صورت آنلاین و رایگان در اختیار شما قرار داده شده است.

پیش‌نیازها

بخش اول

ردیف ها یا ستون های حاوی مقادیر از دست رفته را حذف کنید و یا به روش مناسب به صورت خودکار آنها را پر کنید

قسمت اول ویدئو

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.

قسمت دوم ویدئو

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.
بخش دوم

متغیرهای عددی را با تغییر ماهیت آنها به ویژگی های مفیدی تبدیل کنید

قسمت اول: : تئوری نویززدایی سیگنال‌های EEG ویدئو

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.

قسمت دوم:پیش¬پردازش سیگنال¬های EEG با استفاده از EEGLAB ویدئو

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.
بخش سوم

به پایتون کمک کنید تا تاریخ را به عنوان ترکیبی از روز، ماه و سال تشخیص دهد

قسمت اول:پردازش سیگنال¬های ERP ویدئو

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.

قسمت دوم: استخراج ویژگی‌های آماری و طیفی از سیگنال EEG ویدئو

در مسیر حرفه‌ای شدن

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.
بخش چهارم

از دریافت فایل هایی که به درستی کدگذاری نشده اند اجتناب کنید

قسمت اول:پردازش سیگنال¬های ERP ویدئو

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.

قسمت دوم: استخراج ویژگی‌های آماری و طیفی از سیگنال EEG ویدئو

در مسیر حرفه‌ای شدن

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.
بخش پنجم

به صورت کارآمد مشکل ناسازگاری داده های خودتان را حل کنید

قسمت اول:پردازش سیگنال¬های ERP ویدئو

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.

قسمت دوم: استخراج ویژگی‌های آماری و طیفی از سیگنال EEG ویدئو

در مسیر حرفه‌ای شدن

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.

درخواست مشاوره

برای کسب اطلاعات بیشتر درباره این دوره درخواست مشاوره خود را ارسال کنید و یا با ما در تماس باشید.

درخواست مشاوره
09900023709

نیاز به مشاوره دارید؟

در صورتی که نیاز به مشاوره دارید می توانید فرم را تکمیل نمایید و یا با ما در تماس باشید

درخواست مشاوره رایگان

    دوره های مرتبط

    دوره آموزشی تحلیل داده های فروش محصولات به وسیله زبان برنامه نویسی پایتون

    در این دوره که شامل بیش از 5 ساعت آموزش تخصصی و کاربردی است، شما توانایی انجام یک پروژه صفر تا صد تحلیل کسب‌و‌کارهای اینترنتی در قالب یک پروژه دنیای واقعی را خواهید داشت.

    دوره آموزشی کار با کتابخانه Pandas در Kaggle با استفاده از زبان برنامه نویسی پایتون

    داده های خودتان را به هرشکی که خواهید در بیاورید.

    دوره آموزشی پایتون برای علم داده ، دوره ترجمه شده ماکروسافت

    چرا این دوره رو به شما پیشنهاد می‌کنیم؟ این دوره می‌تونه برای شما به عنوان یه قدم اولیه برای آشنایی…

    chat_bubble_outlineنظرات

    • fattahy( دانشجوی دوره )
      12 اردیبهشت 1401
      پاسخ

      سلام؛
      ویدئوی معرفی دوره پاکسازی دیتا، که در بالای صفحه محصول می باشد، نمایش داده نمی شود، لطفا بررسی نمایید.

      • مدیریت(مدیریت)
        18 اردیبهشت 1401
        پاسخ

        سلام دوست عزیز، نظر شما جهت بررسی به مدرس مربوط ارجاع شد. ممنون از اطلاع‌رسانی‌تون؛

    قوانین ثبت دیدگاه

    • دیدگاه‌های فینگلیش تایید نخواهند شد.
    • دیدگاه‌های نامرتبط به مطلب تایید نخواهد شد.
    • از درج دیدگاه‌های تکراری پرهیز نمایید.
    • امتیاز دادن به دوره فقط مخصوص دانشجویان دوره می‌باشد.

    لغو پاسخ

    نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

    قیمت :

    1,300,000 تومان 599,000 تومان

    امتیاز
    0 از 0 رأی
    بدون امتیاز 0 رای
    1,300,000 تومان 599,000 تومان
    تعداد دانشجو : 9
    نوع دوره: غیر حضوری
    سطح دوره: پیشرفته
    پیش نیاز: برنامه نویسی پایتون
    زبان: فارسی
    6 ساعت
    پنج سرفصل
    روش دریافت: دانلود فایل‌های دوره
    روش پشتیبانی: تلگرام
    درصد پیشرفت دوره: %100
    11.05k بازدید 2 دیدگاه
    هادی احمدی – دانشگاه تربیت مدرس – تهران
    هادی احمدی – دانشگاه تربیت مدرس – تهران
    تحلیل گر کسب و کار (Business Analyst) شرکت ایرانسل، کارشناس ارشد مهندسی فناوری اطلاعات، دانشگاه تربیت مدرس تهران

    دسته: علوم داده
    تبلیغات

    درباره گیلادمیا

    گروه آموزشی علوم کامپیوتر گیلادمیا در فروردین سال 1400 توسط جمعی از دانشجویان تحصیلات تکمیلی رشته‌های مهندسی و علوم کامپیوتر دانشگاه‌های مطرح کشور با رسالت گسترش آموزه‌های بنیادی علوم کامپیوتر افتتاح شد؛

    مجوزهای رسمی

    کلیه حقوق این وب‌سایت نزد «مدرسه علوم کامپیوتر گیلادمیا» محفوظ است.

    ورود

    رمز عبور را فراموش کرده اید؟

    هنوز عضو نشده اید؟ عضویت در سایت