Trong các khóa học trước đó, bạn đã học cách sử dụng tư duy có cấu trúc để giải quyết các vấn đề kinh doanh; chuẩn bị, làm sạch, chuyển đổi và phân tích dữ liệu trong bảng tính và cơ sở dữ liệu; và kể câu chuyện dữ liệu hiệu quả. Như một phần của bộ kỹ năng của bạn đang phát triển, bạn cũng đã học cách tạo ra các biểu đồ dữ liệu động và tương tác trong Tableau. Cho đến nay, các kỹ năng bạn học được chặt chẽ liên quan đến các tính năng và khả năng có sẵn trong bảng tính, cơ sở dữ liệu SQL và Tableau. Nhưng nếu bạn muốn làm việc với dữ liệu của mình theo cách tùy chỉnh hơn? Hoặc nếu các công cụ tiêu chuẩn không có chính xác các tính năng bạn cần? Đây là lúc ngôn ngữ lập trình R có thể rất hữu ích. Sử dụng R, bạn sẽ có thêm tính linh hoạt và kiểm soát đối với dữ liệu và phân tích của mình.
- Nền tảng: Dữ liệu, Dữ liệu Ở Khắp Mọi Nơi
- Đặt Câu Hỏi để Ra Quyết Định Dựa trên Dữ Liệu
- Chuẩn Bị Dữ Liệu để Khám Phá
- Xử Lý Dữ Liệu Từ Bẩn đến Sạch
- Phân Tích Dữ Liệu để Trả Lời Các Câu Hỏi
- Chia Sẻ Dữ Liệu Qua Nghệ Thuật Trực Quan
- Phân Tích Dữ Liệu với Lập Trình R (khóa học này)
- Kết Thúc Phân Tích Dữ Liệu của Google: Hoàn Thiện Một Nghiên Cứu Trường Hợp
Trong khóa học này, bạn sẽ học cách sử dụng ngôn ngữ lập trình R để làm việc với dữ liệu của mình mà không gặp các hạn chế về công cụ. Bạn sẽ có nhiều cơ hội thực hành sử dụng R cho phân tích thống kê và RStudio - một môi trường phát triển tích hợp (IDE) cho R mà bạn sẽ sử dụng để tạo ra các biểu đồ dữ liệu nâng cao với nhiều chi tiết. R giúp bạn dễ dàng trình bày dữ liệu của mình với phong cách tinh tế và nghệ thuật. Một vài ưu điểm khác của R bao gồm:
- Phổ biến: R thường được sử dụng cho phân tích dữ liệu
- Công cụ: R có một thư viện thuận tiện của các công cụ sẵn để làm sạch và phân tích dữ liệu
- Tập trung: R được tạo ra với thống kê trong tâm trí; các nhà phân tích dữ liệu có thể thuận tiện sử dụng một thư viện phong phú của các thuật toán thống kê
- Linh hoạt: R thích ứng tốt cho việc sử dụng trong cả các dự án học máy và phân tích dữ liệu
- Sẵn có: R là một ngôn ngữ lập trình mã nguồn mở
Sau khi bạn trở nên thoải mái và tự tin hơn khi sử dụng R và RStudio, bạn có thể thấy mình tò mò muốn học và thêm ngôn ngữ lập trình khác vào bộ kỹ năng của mình (và sơ yếu lý lịch). Khá thú vị, đúng không?
Nội dung khóa học
Khóa học 7 - Phân tích dữ liệu với ngôn ngữ lập trình R
- Hiểu cơ bản về R: R là một ngôn ngữ lập trình có thể được sử dụng để thực hiện các nhiệm vụ trong mọi giai đoạn của quy trình phân tích dữ liệu. Trong phần này của khóa học, bạn sẽ tìm hiểu về R và RStudio, một môi trường phát triển tích hợp (IDE) cho R. Bạn sẽ khám phá các lợi ích của việc sử dụng RStudio để làm việc với R. RStudio cho phép bạn dễ dàng tận dụng các tính năng và chức năng của R.
- Lập trình bằng RStudio: Trong phần này của khóa học, bạn sẽ khám phá các khái niệm cơ bản liên quan đến R. Bạn sẽ tìm hiểu về các hàm và biến mà bạn có thể sử dụng trong các phép tính và lập trình khác. Bạn cũng sẽ tìm hiểu về R packages, là bộ sưu tập các hàm R, mã nguồn và dữ liệu mẫu mà bạn có thể sử dụng trong RStudio.
- Làm việc với dữ liệu trong R: Ngôn ngữ lập trình R được thiết kế để làm việc với dữ liệu ở mọi giai đoạn của quy trình phân tích dữ liệu. Trong phần này của khóa học, bạn sẽ xem xét cách R có thể giúp bạn cấu trúc, tổ chức và làm sạch dữ liệu của mình thông qua các hàm và quy trình khác. Bạn sẽ tìm hiểu về các khung dữ liệu và cách làm việc với chúng trong R. Bạn cũng sẽ xem xét lại khái niệm về sự thiên vị dữ liệu và cách bạn có thể sử dụng R để giải quyết nó.
- Biểu đồ, thẩm mỹ và chú thích: R là một công cụ tuyệt vời để tạo ra các biểu đồ chi tiết. Trong phần này của khóa học, bạn sẽ học cách sử dụng R để tạo ra và sửa chữa các biểu đồ. Bạn cũng sẽ khám phá các tính năng của R và RStudio có thể giúp bạn cải thiện về mặt thẩm mỹ của biểu đồ. Bạn sẽ học cách chú thích biểu đồ và lưu các thay đổi.
- Tài liệu và báo cáo: R có nhiều tùy chọn khác nhau để khám phá khi bạn sẵn sàng lưu trữ và trình bày phân tích của mình. Trong phần này của khóa học, bạn sẽ khám phá R Markdown, một định dạng tệp để tạo ra tài liệu động với R. Bạn sẽ học cách định dạng và xuất R Markdown và tích hợp các đoạn mã R vào tài liệu của mình.
- Thách thức khóa học: Ở cuối khóa học, bạn sẽ áp dụng tất cả những gì bạn đã học trong Thách thức khóa học. Thách thức khóa học sẽ hỏi bạn về các kỹ năng chính mà bạn đã thực hành và sẽ cho bạn cơ hội để thể hiện những kỹ năng đó trong ba kịch bản.
Bạn đã quen với ngôn ngữ lập trình R chưa?
Nếu bạn đã từng sử dụng R và RStudio trước đó, bạn có thể thấy hai module đầu tiên của khóa học này là một bài ôn tập về các chủ đề cơ bản mà bạn đã hiểu. Hãy thoải mái bỏ qua các video và tài liệu đọc cơ bản này và tiếp tục đến các thách thức của phần cho phần 1 và phần 2. Các thách thức của module sẽ giúp bạn chuẩn bị cho thách thức của khóa học vào cuối khóa học này. Để đạt được chứng chỉ, bạn cần đạt điểm 80% hoặc cao hơn trong tất cả các hoạt động được đánh giá trong chương trình.
Những điều gì bạn có thể mong đợi
Bạn có thể hoàn thành khóa học này trong khoảng bốn đến năm tuần. Điều này bao gồm việc hoàn thành tất cả các hoạt động, bao gồm:
- Các video giảng dạy về các khái niệm mới và minh họa cách sử dụng các công cụ
- Câu hỏi trong video xuất hiện trong suốt hoặc ở cuối video để kiểm tra việc học của bạn
- Tài liệu đọc để giới thiệu ý tưởng mới và phát triển từ các khái niệm từ các video
- Diễn đàn thảo luận để thảo luận, khám phá và củng cố các ý tưởng mới để học tốt hơn
- Câu hỏi thảo luận để thúc đẩy suy nghĩ và sự tham gia trong các diễn đàn thảo luận
- Qwiklabs để giới thiệu các tình huống thực tế trên công việc và các công cụ và nhiệm vụ để hoàn thành các bài tập
- Các bài kiểm tra thực hành để chuẩn bị cho các bài kiểm tra được đánh giá
- Các hoạt động thực hành để củng cố các kỹ năng đã học cho các bài kiểm tra được đánh giá
- Các bài kiểm tra được đánh giá để đo lường tiến độ của bạn và cung cấp phản hồi quý báu
Các hoạt động thực hành thúc đẩy cơ hội bổ sung để xây dựng kỹ năng của bạn, vì vậy hãy cố gắng lấy càng nhiều điều từ chúng càng tốt. Các bài kiểm tra dựa trên cách tiếp cận của khóa học để cung cấp một loạt các tài liệu học và hoạt động rộng lớn khác nhau nhằm củng cố các kỹ năng quan trọng. Cả các bài kiểm tra được đánh giá và không được đánh giá đều sẽ giúp nội dung học chìm vào bộ não và củng cố các kỹ năng quan trọng. Các bài kiểm tra thực hành không được đánh giá là cơ hội cho bạn để chuẩn bị cho các bài kiểm tra được đánh giá, và cả hai loại bài kiểm tra được đánh giá và không được đánh giá có thể được thực hiện nhiều lần.
Như một lời nhắc nhỏ, khóa học này được thiết kế cho tất cả các loại người học, vì vậy không cần có bằng cấp hoặc kinh nghiệm trước đây. Mọi người học một cách khác nhau, và Chứng chỉ Phân tích Dữ liệu của Google đã được thiết kế với điều đó trong tâm trí. Thời hạn cá nhân chỉ là một hướng dẫn, vì vậy hãy thoải mái làm việc theo tốc độ của riêng bạn. Không có hình phạt cho các bài tập trễ. Nếu bạn muốn, bạn có thể kéo dài thời hạn của mình bằng cách quay lại Mục tổng quan trong thanh điều hướng và nhấp vào Chuyển phiên. Nếu bạn đã bỏ lỡ các thời hạn trước đó, hãy nhấp vào Đặt lại thời hạn của tôi thay vào đó.
Nếu bạn muốn xem lại nội dung trước đó hoặc xem trước nội dung sắp tới, bạn có thể sử dụng các liên kết điều hướng ở đầu trang của trang này để đi đến một khóa học khác trong chương trình. Khi bạn hoàn thành tất cả các bài tập cần thiết, bạn sẽ đạt được chứng chỉ của mình.
Mẹo
- Hãy cố gắng hoàn thành tất cả các hoạt động theo thứ tự, vì thông tin mới luôn dựa trên các bài học trước đó.
- Hãy xem mọi nhiệm vụ như là kinh nghiệm thực tế. Hãy nghĩ rằng bạn đang làm việc tại một công ty hoặc tổ chức như một nhà phân tích dữ liệu. Điều này sẽ giúp bạn áp dụng những gì bạn học được trong chương trình này vào thực tế.
- Lặp lại các nhiệm vụ được thực hiện trên riêng của bạn để tăng cường thêm sự thực hành và tốc độ. Ví dụ, sau khi bạn thực hiện các nhiệm vụ đã được minh họa trong video một hoặc hai lần, hãy thử thực hiện các nhiệm vụ tương tự mà không cần phải xem video và nhận sự giúp đỡ từ các gợi ý của giảng viên.
- Mặc dù chúng không được đánh giá, nhưng hãy chắc chắn tham gia và hoàn thành tất cả các hoạt động thực hành. Chúng sẽ giúp bạn xây dựng một nền tảng vững chắc như một nhà phân tích dữ liệu và chuẩn bị cho các đánh giá được đánh giá.
- Tận dụng tất cả các nguồn tài nguyên bổ sung được cung cấp, bao gồm các diễn đàn thảo luận và liên kết đến các bài báo bên ngoài để biết thêm thông tin.
- Khi bạn gặp các liên kết hữu ích trong khóa học, hãy nhớ đánh dấu chúng để bạn có thể tham khảo thông tin để học hoặc xem lại.
- Các nguồn tài nguyên bổ sung là miễn phí, nhưng một số trang giới hạn số lượng bài báo bạn có thể truy cập miễn phí mỗi tháng. Đôi khi bạn có thể đăng ký trên trang web để truy cập đầy đủ, nhưng bạn luôn có thể đánh dấu một nguồn tài nguyên và quay lại xem sau.
- Tối đa hóa giá trị của các hoạt động thực hành. Các hoạt động thực hành bổ sung cho các nhiệm vụ đã được minh họa bằng cách khuyến khích thực hành thêm với các tình huống tương tự. Cú pháp của một ngôn ngữ lập trình sẽ trở nên tự nhiên hơn đối với bạn mỗi khi bạn thực hành sử dụng nó.
- Tạo một sổ ghi chú hoặc tài liệu để ghi lại những điều cần nhớ về cú pháp R. Điều này sẽ trở thành một tài liệu tham khảo tiện ích và cá nhân mà bạn có thể sử dụng trong toàn bộ chương trình còn lại và bất cứ lúc nào sau này.