Khoa học dữ liệu cho sinh viên đại học: Cơ hội và lựa chọn

TS.Phạm Đình Bá- Đại học Toronto, Canada

Untitled.png

Viện Hàn lâm Khoa học, Kỹ thuật Quốc gia, và Y học Hoa Kỳ vừa phát hành một báo cáo về vấn đề khoa học dữ liệu cho sinh viên đại học. Một vài điểm chính trong báo cáo nầy đã được lượt dịch và nêu ra dưới đây cho sinh viên chúng ta để hy vọng mỗi người trong chúng ta có nhận thức về những vấn đề này.  

Khoa học dữ liệu dần dần trở thành một lĩnh vực đang cách mạng hóa khoa học và công nghiệp. Làm việc trên gần như tất cả các ngành nghề đang trở thành định hướng bởi dữ liệu càng ngày càng nhiều, ảnh hưởng đến cả các công ăn việc làm hiện nay và các kỹ năng cần có và đòi hỏi bởi công nghiệp, khoa học và xã hội trong tương lai. Khi dữ liệu càng trở nên phong phú và cách phân tích chúng trở nên dồi dào hơn, rất nhiều khía cạnh của nền kinh tế, xã hội và cuộc sống hàng ngày sẽ trở nên phụ thuộc vào dữ liệu.

Ngày nay, thuật ngữ “nhà khoa học dữ liệu” thường mô tả một nhân viên tri thức, người chủ yếu chuyên về phân tích dữ liệu nhiều và phức tạp. Tuy nhiên, khoa học dữ liệu mở rộng một loạt các hoạt động liên quan đến việc áp dụng các nguyên tắc thu thập dữ liệu, lưu trữ, tích hợp, phân tích, suy luận, giao tiếp và các hành vi đúng đắn trong cách xữ lý dữ liệu. Trong những thập kỷ sau, tất cả sinh viên đại học sẽ được hưởng lợi từ nhận thức cơ bản và năng lực trong khoa học dữ liệu.

Để chuẩn bị cho sinh viên tốt nghiệp của mình cho kỷ nguyên dữ liệu mới này, các cơ sở giáo dục nên khuyến khích phát triển một sự hiểu biết cơ bản về khoa học dữ liệu trong tất cả các sinh viên đại học.

Việc chuyển đổi công việc liên tục trong đời sống hiện nay và tương lai đòi hỏi cả một số lớn công dân trong xã hội với hiểu biết cơ bản về khoa học dữ liệu và một tầng lớp nhân sự đáng kể từ những sinh viên tốt nghiệp nhiều tài năng với kiến thức khoa học và phát triển cao, đào tạo thông qua các môn học và thực hành đáng kể từ khoa học dữ liệu.

Các cơ sở giáo dục nên nắm lấy khoa học dữ liệu như một lĩnh vực mới quan trọng, đòi hỏi sự hướng dẫn cụ thể và được thiết kế thông qua các chuyên ngành và các môn tự chọn trong các ban khoa khác, cũng như phát triển một đội ngũ giảng viên được trang bị để giảng dạy trong lĩnh vực khoa học dữ liệu.

Các chuyên ngành mới và các môn tự chọn trong các ban khoa khác ban đầu sẽ kết hợp các môn hiện có, trong các lĩnh vực như khoa học máy tính, thống kê, phân tích kinh doanh, công nghệ thông tin, tối ưu hóa, toán học ứng dụng và tính toán số. Theo thời gian, khi các tính năng của khoa học dữ liệu được hình thành, các chương trình học thuật sẽ bắt buộc phải phát triển các nhóm kỹ năng mới, và các bộ môn đặc biệt và tài liệu giảng dạy sẽ từ từ phát triển và triển khai.

Khi các chương trình khoa học dữ liệu phát triển, các môn nầy nên tập trung vào việc thu hút sinh viên với nhiều nền tảng và mức độ chuẩn bị khác nhau và chuẩn bị cho các sinh viên nầy tạo nên nền tảng cho sự thành công trong nhiều ngành nghề khác nhau dựa vào khoa học dữ liệu.

Sinh viên tốt nghiệp từ khoa học dữ liệu sẽ làm việc trong hầu hết mọi ngành nghề và sẽ phục vụ trong một số vai trò, bao gồm vận hành các hệ thống phân tích, chuẩn bị dữ liệu để phân tích, xác định và điều phối phân tích, hiển thị thông tin và hỗ trợ quyết định đặc trên dữ liệu chuẩn xát để tăng lên các cơ hội cho việc khám phá những điều tiềm ẩn trong dữ liệu. Những người khác sử dụng kỹ năng khoa học dữ liệu sẽ là nhà báo, quản trị viên, nghệ sĩ, luật sư, giáo viên và những người lao động. Tất cả các công dân nầy cần một số khả năng hiểu và sử dụng dữ liệu. Điều này cần phải chuẩn bị cho sinh viên đa dạng trong nhiều ngành nghề khác nhau. Thực hiện việc nầy làm tăng thêm thách thức cho nền giáo dục từ tiểu học, trung học và đại học.

Một loạt các chương trình giảng dạy thích hợp là cần thiết để chuẩn bị sinh viên cho một tương lai khi họ sẽ cạnh tranh với nhau không chỉ ở Việt Nam, mà còn ở trong khu vực và thế giới giàu dữ liệu trong những năm tới.

Các cơ sở giáo dục nên cung cấp và phát triển một loạt các con đường học tập và đào tạo để chuẩn bị cho sinh viên một mảng các vai trò liên hệ đến dữ liệu tại nơi làm việc. Chúng bao gồm các môn căn bản, các môn giới thiệu, các môn với trình độ đầy đủ ở các cấp, đào tạo cử nhân, và một loạt các môn tự chọn trong các chuyên ngành và chứng chỉ. Các hình thức của các chương trình này và phạm vi của chúng sẽ khác nhau tùy thuộc vào tiêu điểm và văn hóa của các trường và mục tiêu của học sinh và sinh viên.

Các chương trình liên hệ đến khoa học dữ liệu cần phải được bảo đảm chất lượng, mặc dù các môn học liên hệ có thể ở các tiêu điểm khác nhau và với các nhấn mạnh khác nhau. Mục tiêu chính là cung cấp cho tất cả sinh viên theo học trong khoa học dữ liệu khả năng đưa ra các phán đoán tốt, sử dụng các công cụ có trách nhiệm và hiệu quả, và cuối cùng đưa ra quyết định chuẩn bằng cách sử dụng dữ liệu. Để đạt được mục tiêu đó, sinh viên sẽ cần phải tiếp xúc với tài liệu từ nhiều ngành – đặc biệt là cơ sở toán học, thống kê và tính toán – và sinh viên sẽ cần được học và thực hành về thu thập dữ liệu, lập mô hình, quản lý và giám tuyển, hiển thị dữ liệu, quy trình làm việc và khả năng tái tạo, thông tin liên lạc và làm việc theo nhóm, cân nhắc về tầm cụ thể và giải quyết vấn đề theo phương hướng đúng đắn.

Ủy ban nhấn mạnh tính trung tâm của việc học tập và ứng dụng các nguyên tắc hành xử đúng đắn trong việc xử lý, tham gia và nghiên cứu dữ liệu. Những cân nhắc này bao gồm việc quyết định dữ liệu nào cần thu thập, nhận trách nhiệm trong việc sử dụng dữ liệu, xác thực nguồn dữ liệu, xác thực tính chính xác của dữ liệu, thực hiện các bước để giảm thiểu việc bót méo sự thật khi giải thích các tìm hiểu từ dữ liệu, bảo vệ quyền riêng tư của cá nhân trong quá trình thu thập và sử dụng dữ liệu và không có định ý trong việc tìm cách làm vẫn đục dữ kiện. Điều quan trọng là sinh viên học cách nhận ra các vấn đề đạo đức và áp dụng một tiêu chuẩn đạo đức cao trong khoa học và thực nghiệm liên quan đến dữ liệu.

Ph.d Phạm Đình Bá

Tác giả là thành viên của Nghiệp đoàn sinh viên Việt Nam, gửi bài về từ Canada

Tài liệu:

Data Science for Undergraduates: Opportunities and Options. Committee on Envisioning the Data Science Discipline: The Undergraduate Perspective; Computer Science and Telecommunications Board; Board on Mathematical Sciences and Analytics; Committee on Applied and Theoretical Statistics; Division on Engineering and Physical Sciences; Board on Science Education; Division of Behavioral and Social Sciences and Education; National Academies of Sciences, Engineering, and Medicine. National Academies Press. 2018

Advertisements

Trả lời

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Đăng xuất /  Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Đăng xuất /  Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Đăng xuất /  Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Đăng xuất /  Thay đổi )

Connecting to %s