MPGC - ML Pipelines trên Google Cloud

01 ngày

Trong khóa học này, bạn sẽ học về TensorFlow Extended (TFX) – nền tảng máy học (ML) phục vụ production của Google dựa trên TensorFlow để quản lý pipeline ML và metadata.
Các module đầu tiên sẽ thảo luận về các thành phần pipeline, orchestration pipeline với TFX, cách tự động hóa pipeline qua CI/CD, và cách quản lý ML metadata.
Tiếp đó, bạn sẽ học cách tự động hóa và tái sử dụng pipeline ML trên nhiều framework ML như TensorFlow, PyTorch, Scikit-learn và XGBoost.
Bạn cũng sẽ học cách dùng Cloud Composer để orchestrate pipeline training liên tục, và MLflow để quản lý toàn bộ vòng đời ML.

• Orchestrate quy trình training & deployment mô hình với TFX và Cloud AI Platform.
• Vận hành các mô hình ML đã triển khai một cách hiệu quả & tối ưu.
• Thực hiện training liên tục (Continuous Training) sử dụng các framework khác nhau (Scikit Learn, XGBoost, PyTorch) và orchestration pipeline bằng Cloud Composer & MLflow.
• Tích hợp workflow ML với upstream & downstream data workflow để duy trì end-to-end lineage và quản lý metadata.

• Data Scientist muốn nhanh chóng đưa prototype ML thành production để tạo tác động kinh doanh.
• Software Engineer muốn phát triển kỹ năng Machine Learning Engineering.
• ML Engineer muốn áp dụng Google Cloud.

Để học tốt khóa này, học viên cần:
• Hoàn thành khóa Machine Learning with Google Cloud hoặc có kinh nghiệm tương đương.
• Hoàn thành khóa MLOps Fundamentals.

Sau khi hoàn tất khóa học, học viên sẽ được cấp chứng nhận hoàn tất khóa học theo quy định của Cecomtech.

Khóa học gồm bài giảng, demo và lab thực hành.

Module 1: Giới thiệu về TFX

• Hiểu tổng quan các thành phần pipeline tiêu chuẩn của TFX.
• Dùng TFX Interactive Context để phát triển prototype pipeline TFX.
• Làm việc với thư viện TensorFlow Data Validation (TFDV) để kiểm tra & phân tích dữ liệu đầu vào.
• Sử dụng TensorFlow Transform (TFT) để tiền xử lý dữ liệu & transform đặc trưng ở quy mô lớn.
• Dùng KerasTuner để tinh chỉnh hyperparameter mô hình.
• Dùng TensorFlow Model Analysis (TFMA) để đánh giá mô hình.

Module 2: Orchestration pipeline với TFX

• Dùng TFX CLI & Kubeflow UI để build & deploy pipeline TFX lên AI Platform Pipelines của Google Cloud.
• Deploy mô hình TensorFlow đã train bằng AI Platform Training lên AI Platform Prediction.
• Thực hiện hyperparameter tuning phân tán nâng cao với CloudTuner & Cloud AI Platform Vizier.

Module 3: Custom components & CI/CD cho pipeline TFX

• Phát triển workflow CI/CD với Cloud Build để build & deploy pipeline TFX.
• Tích hợp Github trigger để kích hoạt Cloud Build CI/CD cho pipeline TFX.

Module 4: ML Metadata với TFX

• Truy cập & phân tích các artifact của pipeline trong ML Metadata store.

Module 5: Continuous Training với đa SDK, KubeFlow & AI Platform Pipelines

• Thực hiện training liên tục với Scikit-learn & AI Platform Pipelines.
• Thực hiện training liên tục với PyTorch & AI Platform Pipelines.
• Thực hiện training liên tục với XGBoost & AI Platform Pipelines.
• Thực hiện training liên tục với TensorFlow & AI Platform Pipelines.

Module 6: Continuous Training với Cloud Composer

• Thực hiện training liên tục với Cloud Composer.

Module 7: ML Pipeline với MLflow

• Quản lý vòng đời Machine Learning với MLflow.

Module 8: Tổng kết

• Tổng kết lại toàn bộ khóa học.

Đăng ký khóa học

Vui lòng bật JavaScript trong trình duyệt của bạn để hoàn thành Form này.