Gần đây, có rất nhiều bạn trẻ, không chỉ ở Việt Nam mà còn ở nước ngoài, đã hỏi tôi về công việc phân tích dữ liệu. Sau khi tìm hiểu, tôi nhận ra trên mạng có quá nhiều thông tin sai lầm, quá trọng, và không thực tế về các kỹ năng và kiến thức mà một chuyên gia phân tích dữ liệu cần có. Điều này làm cho các bạn trẻ không biết bắt đầu từ đâu, cảm thấy bối rối về khả năng của mình và do đó không dám thực sự bắt đầu do sợ có quá nhiều yêu cầu về kỹ năng.
Vì vậy, tôi sẽ điểm qua một số điều mà bạn không thực sự cần (hoặc cần nhưng không cần đến mức quá trọng) trước khi chúng ta tập trung vào các kỹ năng thực sự quan trọng cho công việc này. Dưới đây là những kinh nghiệm và quan sát thực tế từ một năm làm việc trong lĩnh vực này của tôi.
1. Những Điều Bạn Không Thực Sự Cần
1.1 Siêu Sao Toán Học
Khác biệt với quan điểm của nhiều người rằng bạn phải là một thiên tài Toán học để trở thành một chuyên gia phân tích dữ liệu, tôi tin rằng bạn chỉ cần hiểu biết cơ bản về Toán học, nắm vững các khái niệm phía sau các công thức và mô hình Toán học và Xác suất thống kê. Vì sao? Bởi vì có rất nhiều thuật toán phức tạp và các con số rắc rối (mà khi còn học, chúng ta thường phải tính toán cẩn thận bằng tay hoặc máy tính) đã được phần mềm hiện đại giải quyết. Điều quan trọng là hiểu rõ các khái niệm cơ bản để có thể thiết kế cho phần mềm tính toán ra các kết quả mà bạn mong đợi. Bản thân tôi không phải là người giỏi Toán học (thậm chí là người học Chuyên Văn) nhưng thực tế đã chứng minh rằng hiểu biết cơ bản về Toán học là đủ để bắt đầu với lĩnh vực này.
1.2 Kỹ Năng Vượt Trội Về Phần Mềm, Lập Trình
Để bắt đầu trong lĩnh vực này, bạn cần biết sử dụng một số phần mềm cơ bản để phân tích số liệu, nhưng nếu bạn không phải là chuyên gia từ đầu, đừng lo lắng quá. Vì tất cả phần mềm, lập trình đều có thể học được và học nhanh thông qua thực hành trong công việc. Người chưa từng làm thì sợ học kỹ thuật, nhưng người đã có kinh nghiệm sẽ biết rằng học rất dễ dàng, đặc biệt khi tập trung vào kỹ thuật phù hợp với công việc. Tôi chẳng biết gì về SQL khi phỏng vấn, nhưng vẫn được nhận; sau đó, chỉ qua 5 ngày học online, tôi đã thành thạo SQL. Đừng để thiếu kỹ năng làm bạn sợ hãi, bạn có thể học mọi thứ và trở nên giỏi ngay từ đầu không cần có kinh nghiệm!
1.3 Bằng Cấp Chuyên Sâu Về Phân Tích Dữ Liệu
Dù có bằng cấp về tính toán, phân tích dữ liệu, công nghệ thông tin, kinh tế... cũng không phải là điều bắt buộc. Trong ngành mới này, kỹ năng và kinh nghiệm quan trọng hơn bằng cấp. Vị trí hiện tại của tôi chỉ yêu cầu bằng Đại học và tôi không học chuyên ngành data. Nếu bạn không có bằng chuyên ngành này, đừng quá lo lắng và đừng nên quyết định học lại Đại học, có nhiều cách khác để nâng cao kiến thức và kỹ năng cho ngành này.
2. Những Điều Bạn Thực Sự Cần
2.1 Tư Duy Logic Tốt
Để thành công trong lĩnh vực này, việc suy luận logic là không thể thiếu. Bạn cần phải có khả năng đọc và hiểu các dữ liệu lớn, tìm hiểu nguyên nhân của các con số, và nhận biết những lỗ hổng nếu có. Mặc dù nhiều người giỏi về thuật toán và lập trình, nhưng nếu thiếu suy luận logic, họ có thể rơi vào việc chỉ tập trung vào kết quả ban đầu mà bỏ qua ý nghĩa của quá trình phân tích dữ liệu sau này. Điều này dẫn đến việc khi báo cáo cho cấp trên, họ có thể sử dụng các thuật ngữ toán học phức tạp nhưng không thể trình bày rõ ràng ý nghĩa và logic của kết quả. Đây cũng là lý do mà người tiền nhiệm của tôi không thành công trong vị trí này theo đánh giá của đồng nghiệp.
Không ngần ngại tìm hiểu và đặt ra những câu hỏi khó khăn là yếu tố quan trọng để thành công. Mỗi bộ dữ liệu đều có một lịch sử và mục đích riêng, và việc hiểu rõ chúng cũng như phương pháp thu thập sẽ giúp bạn phân tích dữ liệu hiệu quả hơn. Điều này đòi hỏi sự đam mê khám phá, không ngừng học hỏi, và sẵn lòng đặt câu hỏi để tìm ra những bộ dữ liệu tốt nhất.
Kỹ năng sắp xếp và quản lý dữ liệu là quan trọng, nhưng cũng cần linh hoạt để thích nghi với các tình huống khác nhau. Bạn cần có khả năng tổ chức công việc tốt, nhưng đồng thời cũng linh hoạt để điều chỉnh khi cần thiết.
Đặt câu hỏi và tìm hiểu sâu hơn về dữ liệu giúp bạn hiểu rõ hơn về ngữ cảnh và mục đích của từng bộ dữ liệu, từ đó phân tích dữ liệu một cách chính xác và hiệu quả hơn.
Để làm việc tốt với dữ liệu, bạn cần có khả năng tập trung cao, cẩn thận và linh hoạt trong xử lý các tình huống khác nhau. Điều này đòi hỏi bạn phải có kiên nhẫn và khả năng tổ chức công việc tốt.
2.4 Kỹ năng sắp xếp, quản lý tốt nhưng cũng mềm dẻo, linh hoạt
Làm việc với dữ liệu thực tế, đặc biệt là dữ liệu chính (số liệu thu thập tự) khác biệt hoàn toàn so với việc làm việc trên sách vở hoặc dữ liệu phụ (số liệu có sẵn). Số liệu thực tế trước khi được 'clean' thường rất phức tạp và không có trật tự, mỗi nơi có một cách tổ chức khác nhau và không bao giờ đầy đủ trong một file duy nhất... Vì vậy, một Data Analyst cần phải có kỹ năng quản lý và sắp xếp dữ liệu tốt. Dữ liệu trên máy tính và các file cần được tổ chức theo hệ thống rõ ràng, dễ tra cứu sau này. Tuy nhiên, ngoài ra, Data Analyst cũng cần phải linh hoạt và mềm dẻo, vì dữ liệu thực tế có thể thay đổi hàng ngày, do đó cần thường xuyên cập nhật, chỉnh sửa và xác định để giữ chỗ trống cho các sai sót và thay đổi sau này.