Một ngày trong cuộc đời của một nhà khoa học dữ liệu

Hướng dẫn nghề nghiệp Nhà khoa học dữ liệu của BrainStation có thể giúp bạn thực hiện những bước đầu tiên để hướng tới sự nghiệp sinh lợi trong khoa học dữ liệu. Đọc để biết tổng quan về cách các Nhà khoa học dữ liệu dành cả ngày làm việc.

Trở thành nhà khoa học dữ liệu

Nói chuyện với Cố vấn học tập để tìm hiểu thêm về cách các khóa đào tạo và khóa học của chúng tôi có thể giúp bạn trở thành Nhà khoa học dữ liệu.



Bằng cách nhấp vào Gửi, bạn chấp nhận Điều kiện .



Nộp

Không thể gửi! Làm mới trang và thử lại?

Tìm hiểu thêm về Chương trình đào tạo Khoa học Dữ liệu của chúng tôi

Cảm ơn bạn!

Chúng tôi sẽ liên lạc sớm.



Xem trang Bootcamp của Data Science

Một ngày trong cuộc đời của một nhà khoa học dữ liệu

Trong số tất cả các lĩnh vực được kiểm tra trong Khảo sát kỹ năng kỹ thuật số của Brainstation, khoa học dữ liệu có thể bao gồm phạm vi ứng dụng rộng rãi nhất. Nhưng mặc dù khoa học dữ liệu đã tồn tại trong nhiều thập kỷ, nhưng nó chỉ mới bắt đầu nở rộ trong thời gian gần đây. Briana Brownell, Người sáng lập kiêm Giám đốc điều hành của Pure Strategy, đồng thời là Nhà khoa học dữ liệu trong 13 năm, cho biết khi sự sẵn có của dữ liệu ngày càng mở rộng, các công ty đã nhận ra rằng khoa học dữ liệu có thể quan trọng như thế nào. Mọi công ty hiện nay cần tập trung một phần vào công nghệ. Chẳng hạn, chỉ trong tuần này, McDonald’s đã trả ước tính 300 triệu USD để mua lại công ty dữ liệu lớn của riêng mình.

Do đó, không có gì ngạc nhiên khi sự cạnh tranh dành cho các Nhà khoa học dữ liệu là cực kỳ cao. Chỉ trong hai năm, nhu cầu dự kiến ​​sẽ tăng 28%, tương đương với khoảng 2,7 triệu việc làm mới. Đó là nhiều cơ hội hơn sinh viên mới tốt nghiệp có thể lấp đầy — nghĩa là nhân viên công nghệ trong các lĩnh vực khác sẽ phải trau dồi kỹ năng và chuyển đổi sang dữ liệu để đáp ứng nhu cầu này.

Trên thực tế, cuộc khảo sát của chúng tôi cho thấy điều này đã xảy ra. Khoảng bốn trong số năm chuyên gia dữ liệu bắt đầu sự nghiệp của họ bằng một công việc khác và 65% trong số các Nhà khoa học dữ liệu đã làm việc trong lĩnh vực này từ năm năm trở xuống. Brownell nói; một mặt, có rất nhiều ý tưởng mới xuất hiện, cô ấy nói. Khi tôi xem một số nội dung đến từ cộng đồng khoa học dữ liệu, tôi ngạc nhiên về mức độ đổi mới của nó. Tuy nhiên, flipside là một xu hướng phát minh lại bánh xe.



Nhu cầu cao đối với Nhà khoa học dữ liệu là rất lớn nếu bạn là một (hoặc đang nghĩ đến việc trở thành một nhà khoa học), nhưng đối với nhà tuyển dụng, tuyển dụng có thể là một thách thức khó khăn. Ở đây, đào tạo lại kỹ năng là một giải pháp hiển nhiên; việc đào tạo lại một nhân viên hiện tại về khoa học dữ liệu có thể tiết kiệm chi phí hơn là săn đầu người mới.

Nhưng ngay cả khi bạn có kế hoạch thuê một nhóm khoa học dữ liệu mới, toàn bộ tổ chức của bạn có thể cần phải nâng cao kiến ​​thức về dữ liệu của mình, Brownell cảnh báo. Mọi người đều muốn làm việc gì đó có ảnh hưởng đến nơi làm việc của họ, điều đó làm cho cuộc sống của mọi người tốt hơn, cô ấy nói. Nếu văn hóa công ty của bạn không đến mức [Các nhà khoa học dữ liệu của bạn] có thể tạo ra tác động, thì gần như không thể tuyển dụng được. Ban lãnh đạo không chỉ phải có khả năng truyền đạt cho những người thuê tiềm năng cách họ có thể đóng góp — mà còn hiểu được các đề xuất mà nhóm khoa học dữ liệu của họ cuối cùng cũng đưa ra.

Thật không may, Brownell nói, phần lớn không thoải mái là các công ty chưa tìm ra mọi thứ. Cuộc khảo sát của chúng tôi ủng hộ điều này: hầu hết những người được hỏi (52 phần trăm) mô tả mức độ hiểu biết về dữ liệu trong các tổ chức của họ là cơ bản, với mức độ trung bình là câu trả lời phổ biến nhất tiếp theo (31 phần trăm). Điều này cho thấy rằng một số khóa đào tạo về khoa học dữ liệu nền tảng có thể hữu ích cho phần lớn các công ty — đặc biệt là trong giới lãnh đạo.



Nhu cầu cải thiện kiến ​​thức về dữ liệu — và giao tiếp — được nâng cao bởi cách cấu trúc hầu hết các nhóm khoa học dữ liệu: như một nhóm rời rạc, thường có 10 người trở xuống (theo 71 phần trăm số người được hỏi) và thường là năm người trở xuống (38 phần trăm ). Những đội gắn bó chặt chẽ này không thể bị cô lập. Brownell giải thích, các cá nhân làm việc trong các công ty lớn hơn thường nằm trong một nhóm cụ thể về khoa học dữ liệu và khách hàng của họ là nội bộ — các bộ phận khác của tổ chức, vì vậy, đó là một nhóm phải hoạt động trên nhiều lĩnh vực khác nhau của tổ chức.

Khoa học dữ liệu chính xác là gì?

Brownell nói rằng nhận thức thông thường (rằng các nhà khoa học dữ liệu đã thu thập được số liệu) không quá xa so với mức bình thường. Có rất nhiều tập dữ liệu cần được tiết lộ thông tin chi tiết từ chúng và bao gồm rất nhiều bước như xây dựng mô hình và dọn dẹp dữ liệu, thậm chí chỉ cần quyết định xem bạn cần dữ liệu nào. Tuy nhiên, cuối cùng, nỗ lực này là hướng tới mục tiêu: Về cốt lõi, bạn cần làm điều gì đó với dữ liệu.

Đối với vấn đề đó, dữ liệu không phải lúc nào cũng là những con số. Trong khi phần lớn người được hỏi (73%) cho biết họ làm việc với dữ liệu số, 61% cho biết họ cũng làm việc với văn bản, 44% với dữ liệu có cấu trúc, 13% với hình ảnh và 12% với đồ họa (và một số ít người thậm chí còn làm việc với video và âm thanh —6 phần trăm và 4 phần trăm tương ứng). Các kết quả khảo sát này gợi ý về cách khoa học dữ liệu đang mở rộng vượt xa các bảng tài chính, thu hút mọi người cho các dự án như tối đa hóa sự hài lòng của khách hàng hoặc thu thập thông tin chi tiết có giá trị từ vòi chữa cháy của phương tiện truyền thông xã hội.

Kết quả là, có rất nhiều sự đa dạng trong lĩnh vực khoa học dữ liệu, Brownell nói. Mỗi ngành đều có cách xử lý riêng về loại dữ liệu mà Nhà khoa học dữ liệu làm việc, loại kết quả mà họ mong đợi và cách điều đó phù hợp với cấu trúc lãnh đạo của công ty họ. Tuy nhiên, trong mọi trường hợp, mục tiêu là tận dụng dữ liệu để giúp công ty đưa ra quyết định tốt hơn. Điều đó có thể là làm cho sản phẩm tốt hơn, hiểu thị trường mà họ muốn thâm nhập, giữ chân nhiều khách hàng hơn, hiểu cách sử dụng lực lượng lao động của họ, hiểu cách kiếm được người thuê tốt — tất cả những thứ khác nhau.

Công việc Khoa học Dữ liệu

Trong một số lĩnh vực công nghệ, trở thành một nhà tổng quát học có thể là bước đi tốt nhất của bạn — không phải như vậy với khoa học dữ liệu. Các nhà tuyển dụng thường tìm kiếm các kỹ năng chuyên biệt cho ngành của họ. Bởi vì khoa học dữ liệu có rất nhiều loại khác nhau, cuộc khảo sát của chúng tôi đã khảo sát sâu hơn, xem xét năm hạng mục công việc chính: Nhà phân tích dữ liệu, Nhà nghiên cứu, Nhà phân tích kinh doanh, Người quản lý dữ liệu và phân tích và Nhà khoa học dữ liệu thích hợp.

Trên tất cả các chức danh công việc này, việc thu thập và dọn dẹp dữ liệu chiếm phần lớn thời gian của một người — nhưng kết quả là gì? Thông thường, mục tiêu là tối ưu hóa nền tảng, sản phẩm hoặc hệ thống hiện có (45%) hoặc phát triển những nền tảng, sản phẩm hoặc hệ thống mới (42%). Tìm hiểu sâu hơn, chúng tôi nhận thấy rằng việc tối ưu hóa các giải pháp hiện có có xu hướng thuộc về Nhà phân tích kinh doanh và Nhà phân tích dữ liệu, trong khi việc phát triển các giải pháp mới thường thuộc về các Nhà khoa học và Nhà nghiên cứu dữ liệu.

Các kỹ thuật mà Các nhà khoa học dữ liệu sử dụng cũng khác nhau trong các chuyên ngành. Hồi quy tuyến tính là một công cụ phổ biến trên tất cả các danh mục, được 54% người trả lời trích dẫn, nhưng có một vài điều ngạc nhiên khi chúng tôi xem xét phần mềm mà mọi người đang sử dụng.

Excel — công cụ thao tác tập dữ liệu — hầu như phổ biến, được trích dẫn bởi 81 phần trăm tất cả những người được hỏi và là công cụ phổ biến nhất trong mọi danh mục ngoại trừ các Nhà khoa học dữ liệu thích hợp (những người thường xuyên dựa vào Python — và cũng trích dẫn một bộ công cụ lớn hơn các danh mục khác ). Điều gì khiến Excel không thể sử dụng được, ngay cả trong năm 2019?

Điều mà tôi yêu thích ở Excel là cách nó cho phép bạn xem dữ liệu và có cảm nhận trực quan về nó, Brownell giải thích. Chúng tôi cũng sử dụng rất nhiều Python và trong trường hợp đó, khi bạn thực hiện phân tích trên một tệp dữ liệu, tệp đó sẽ bị ẩn; trừ khi bạn lập trình cụ thể một phần mã của mình để thực hiện một số hình dung về dữ liệu thô mà bạn đang phân tích, bạn sẽ không nhìn thấy nó. Trong khi với Excel, nó ở ngay trước mắt bạn. Điều đó có rất nhiều lợi thế. Đôi khi bạn có thể phát hiện ra các vấn đề với tệp dữ liệu. Tôi không thấy Excel biến mất khỏi phân tích bao giờ.

Điều đó nói rằng, vẫn còn một danh sách dài các chương trình khác được sử dụng trong lĩnh vực này — không ngạc nhiên với tính đa dạng của nó. SQL (43 phần trăm) và Python (26 phần trăm) dẫn đầu về mức độ phổ biến, với Tableau (23 phần trăm), R (16 phần trăm), Máy tính xách tay Jupyter (14 phần trăm) và một số ít khác đạt được những con số đáng kể — chưa kể đến con số khổng lồ 32% số người được hỏi đã trích dẫn các công cụ khác, thậm chí đã đưa ra danh sách đã dài này.

Tương lai của Khoa học Dữ liệu là gì?

Cuối cùng, chúng tôi hỏi những xu hướng nào sẽ định hình bối cảnh kỹ thuật số trong vòng 5 đến 10 năm tới. Học máy và AI — cả hai đều có ứng dụng trong khoa học dữ liệu — là những phát triển mà người trả lời mong đợi sẽ có tác động lớn nhất, lần lượt là 80% và 79%. Điều này mặc dù thực tế là chưa đến một phần tư (23%) trong số chúng hiện hoạt động với AI.

Brownell, người có công ty phát triển các sản phẩm AI khẳng định, trí tuệ nhân tạo hoàn toàn có thể biến đổi khoa học dữ liệu. Đó thực sự là vinh quang của phương pháp học tập không giám sát. Chúng tôi chỉ có quá nhiều thời gian để xem xét những tập dữ liệu này và đặc biệt là với những tập dữ liệu lớn, rất khó để thực hiện mọi thứ. Các công cụ AI có thể giúp tiết lộ điều gì đó mà có thể bạn sẽ không nghĩ đến việc tìm kiếm. Chúng tôi chắc chắn đã có điều đó xảy ra.

Các xu hướng khác Các nhà khoa học dữ liệu dự kiến ​​sẽ thống trị trong tương lai gần: Internet vạn vật (51%), blockchain (50%) và Thương mại điện tử (36%), thực tế tăng cường và thực tế ảo (38% và 27%), và thậm chí cả giọng nói- dựa trên trải nghiệm (25 phần trăm) —tất cả các chương trình quan trọng và tất cả các lĩnh vực mà khoa học dữ liệu có thể được sử dụng tốt.

Kategori: Tin Tức