ML-2
- Python basics for data science
- NumPy, Pandas, Matplotlib, Scikit-Learn
- Data loading, preprocessing, visualization
- Working with Jupyter Notebook
ML-3
- Data cleaning: handling missing values, outliers
- Feature engineering and feature selection
- Normalization and standardization
- Train-test split, cross-validation
- Imbalanced data handling (SMOTE, class weights)
ابزارها و زبانهای برنامهنویسی در یادگیری ماشین
- مروری بر پایتون برای علوم داده
- معرفی کتابخانهها: NumPy Pandas، Matplotlib، Scikit-learn
- بارگذاری داده، پیشپردازش و مصورسازی
- کار با Jupyter Notebook
پیشپردازش دادهها (Data Preprocessing)
- پاکسازی دادهها: دادههای گمشده، نویزی، پرت
- مهندسی ویژگیها و انتخاب ویژگی
- نرمالسازی و استانداردسازی دادهها
- تقسیم داده به آموزش/آزمون، Cross-Validation
- مدیریت دادههای نامتوازن SMOTE