Bạn thực sự không thể đầu tư vào một nhóm dữ liệu quá sớm. Đó là điều chúng tôi đã học được với tư cách là một nhóm nhỏ nhưng đang phát triển. Chúng tôi đã đầu tư vào một nhóm dữ liệu ngay từ giai đoạn đầu để có thể thiết lập xu hướng sử dụng sản phẩm, tạo thông tin chi tiết về doanh nghiệp và xác định các lĩnh vực cần cải thiện sản phẩm của mình.
Nếu bạn là công ty khởi nghiệp ở giai đoạn đầu, hãy bắt đầu xây dựng kiến trúc và nhóm chiến lược dữ liệu ngay khi có thể. Bạn không cần phải làm lớn—nhóm dữ liệu một người có thể tạo ra sự khác biệt lớn đối với thành công của bạn khi bạn phát triển.
Khi bắt đầu khởi chạy nhóm dữ liệu của mình, bạn có thể muốn thuê một chuyên gia từ thương hiệu lớn nhất có thể. Lời khuyên của chúng tôi: hãy tìm một người có kinh nghiệm khởi nghiệp ở giai đoạn đầu và cũng đã làm việc với dữ liệu trên quy mô lớn.
Có những người tuyệt vời với bộ óc thông minh làm việc trong các nhóm dữ liệu doanh nghiệp lớn, nhưng những nhóm lớn này thường có nhân viên chuyên về các phần cụ thể của nền tảng dữ liệu của họ. Điều đó hợp lý khi bạn có 10 kỹ sư dữ liệu trong một nhóm hoặc khi bạn có một nhóm lớn gồm các nhà khoa học dữ liệu máy học đang nghiên cứu các thuật toán định giá. Nhưng khi bạn chỉ có một vai trò dữ liệu cho toàn bộ tổ chức, bạn cần một người có thể làm từng chút một mọi việc.
Điều quan trọng trước tiên là thuê một người toàn diện, người có thể tạo thông tin chi tiết về dữ liệu, phát triển các giả thuyết kinh doanh và tạo kiến trúc dữ liệu có thể mở rộng từ đầu. Bạn cần ai đó sẵn sàng bắt đầu xây dựng nhóm dữ liệu từ đầu, tốt nhất là ai đó có thể thuê những người còn lại trong nhóm của bạn sau khi bạn sẵn sàng làm việc đó.
Người thuê đầu tiên này phải là người có kinh nghiệm xây dựng (hoặc ít nhất là làm việc trên) nhóm dữ liệu khi khởi nghiệp ở giai đoạn đầu. Họ cần có khả năng tạo ra giá trị một cách nhanh chóng và có sự nhạy bén trong kinh doanh để đặt ra những câu hỏi phù hợp. Họ sẽ có thể tiếp cận dữ liệu theo cách 80/20 để mang lại kết quả ngay lập tức thay vì đi sâu vào những vấn đề khó khăn nhất mà bạn gặp phải.
Đối với khía cạnh kỹ thuật dữ liệu, thông thường bạn sẽ thuê một nhà tư vấn hoặc nhà thầu để giúp thiết lập kiến trúc của mình. Chúng tôi quyết định bổ sung cho lần thuê đầu tiên của mình bằng một nhà tư vấn. Bằng cách này, chúng tôi có được những điều tốt nhất của cả hai thế giới – một chuyên gia về kỹ thuật dữ liệu bán thời gian và một nhà tổng quát có thể duy trì kiến trúc dữ liệu hàng ngày. Chúng tôi thiết lập nền tảng vững chắc và cũng giữ kiến thức của chúng tôi trong nhà.
Ngay cả khi bạn không thể thuê ngay tất cả các vai trò mà bạn muốn trong nhóm dữ liệu của mình trong thời gian dài, thì bạn vẫn có thể làm được rất nhiều việc chỉ với một hoặc hai người phù hợp. Điều quan trọng là suy nghĩ về khả năng mở rộng và hiệu quả. Điều gì giúp nhóm dữ liệu của bạn làm được nhiều hơn với chi phí ít hơn? Và điều này sẽ hoạt động như thế nào khi nhóm của bạn lớn hơn?
Các phân tích có thể mở rộng là cực kỳ quan trọng với một nhóm dữ liệu nhỏ. Bằng cách suy nghĩ trước về cách các quy trình và luồng công việc của bạn sẽ hoạt động khi nhóm của bạn phát triển, bạn sẽ tiết kiệm thời gian và tạo ra các giải pháp có giá trị cho một số vấn đề tốn nhiều thời gian nhất của nhân viên.
Ví dụ: chúng tôi ngay lập tức nhận ra rằng nhóm bán hàng của chúng tôi không có khả năng nhìn thấy việc sử dụng sản phẩm của khách hàng tiềm năng và nó sẽ xuất hiện thường xuyên. Vì vậy, chúng tôi đã xây dựng cho các đại diện bán hàng của mình một bảng điều khiển không gian làm việc để họ có thể tự lấy dữ liệu. Công việc của nhóm dữ liệu của chúng tôi là cho phép ra quyết định dựa trên dữ liệu. Khi chúng tôi nhìn thấy cơ hội đầu tư dữ liệu một lần có thể giúp tiết kiệm hàng trăm giờ cho bộ phận bán hàng, chúng tôi đã hành động.
Một nhóm dữ liệu nhỏ cũng nên tập trung vào việc ngăn ngừa các sự cố trong tương lai. Nếu bạn chỉ có số lượng nhân sự cho nhóm dữ liệu một người vào lúc này, hãy để họ tập trung vào các vấn đề lớn nhất của bạn nhưng cũng dành thời gian để duy trì và mở rộng quy mô kiến trúc dữ liệu của bạn nhằm giảm nợ công nghệ.
Ngay từ đầu, mục tiêu của chúng tôi là hướng tới tương lai với mọi quyết định.
Giống như tất cả các công ty khởi nghiệp, chúng tôi muốn tạo ROI ngay lập tức. Chúng tôi sử dụng kho dữ liệu tập trung, đây là nguồn sự thật duy nhất của chúng tôi – không có gì gây tổn hại cho các nhóm dữ liệu hơn là có dữ liệu bị phân mảnh hoặc không đáng tin cậy. Chúng tôi có thể hợp nhất dữ liệu của mình nhờ tự động hóa và tích hợp.
Điều này giúp chúng tôi cung cấp thông tin chi tiết có giá trị cho toàn bộ công ty với mức tăng thấp.
Chúng tôi sắp xếp tất cả dữ liệu của mình bằng các công cụ ELT như Phân đoạn (cũng là công cụ thu thập dữ liệu của chúng tôi), Fivetran và các giai đoạn bên ngoài của Snowflake.
Chúng tôi sử dụng
Chúng tôi sử dụng Điều tra dân số để gửi dữ liệu kho của mình trở lại những nơi như HubSpot và Courier. Điều này cho phép các nhóm bán hàng và tiếp thị của chúng tôi truy cập thông tin này trên nền tảng mà họ đang sử dụng hàng ngày.
Metabase là công cụ BI của chúng tôi. Nó cho phép chúng tôi tạo bảng điều khiển, viết truy vấn SQL và cung cấp định dạng tự phục vụ cho người dùng không có kỹ thuật. Chúng tôi nhận thấy rằng việc tạo các loại bảng điều khiển dữ liệu tự phục vụ này cho phép người dùng trả lời nhiều câu hỏi của riêng họ. Họ nhanh chóng phát triển mà không cần đầu tư lớn trước như các nhóm sử dụng Looker hoặc Tableau.
Ví dụ: chúng tôi có một dấu gạch ngang KPI hiển thị các số liệu hàng đầu trong toàn công ty. Chúng tôi cũng có thể theo dõi hiệu suất của từng không gian làm việc và xác định các không gian làm việc mà chúng tôi có thể nhắm mục tiêu cho nhóm bán hàng của mình. Chúng tôi cũng đã đưa việc ra quyết định dựa trên dữ liệu vào quá trình phát triển sản phẩm của mình bằng cách tìm hiểu sâu về cách sử dụng sản phẩm của khách hàng. Một ví dụ là chúng tôi nhận thấy rằng rất nhiều người dùng của chúng tôi đang tạo phiên bản Courier của riêng họ thay vì tham gia phiên bản Courier hiện có của đồng nghiệp. Sử dụng thông tin chi tiết này, nhóm sản phẩm của chúng tôi đã quay lại bảng vẽ để tạo một trang hiển thị các không gian làm việc của Courier được tạo bởi cùng một miền email doanh nghiệp để bạn có thể dễ dàng yêu cầu quyền truy cập.
Chúng tôi cũng sử dụng Propel để hỗ trợ các phân tích trong ứng dụng của mình nhằm cung cấp khả năng hiển thị cho người dùng cuối của chúng tôi. Một cách mà chúng tôi sử dụng Propel là cung cấp phân tích mẫu cho các khách hàng cấp Doanh nghiệp của chúng tôi. Propel cho phép các kỹ sư của chúng tôi dễ dàng đưa trực quan hóa GraphQL lên đầu các chỉ số từ kho hàng của chúng tôi.
Bây giờ, chúng tôi đang bước vào thời kỳ tăng trưởng, vì vậy, một cách tự nhiên, chúng tôi đang phát triển lại phương pháp tiếp cận dữ liệu của mình. Mục tiêu hiện tại của chúng tôi là cho phép các nhà khoa học dữ liệu xây dựng kiến thức chuyên môn về chủ đề trong khi vẫn duy trì các tiêu chuẩn dữ liệu tập trung.
Cấu trúc hiện tại của chúng tôi là tập trung, với một kỹ sư phân tích cao cấp báo cáo cho người đứng đầu về dữ liệu. Nó hiện đang hoạt động vì chúng tôi vẫn đang trong giai đoạn đầu xây dựng nhóm dữ liệu. Nhưng khi nhóm mở rộng, chúng tôi sẽ chuyển sang mô hình kết hợp.
Các nhà khoa học dữ liệu sẽ phụ trách một số lĩnh vực kinh doanh nhất định (chẳng hạn như nhóm sản phẩm), nhưng họ vẫn sẽ báo cáo với Trưởng bộ phận Dữ liệu. Điều này sẽ cho phép các nhà khoa học dữ liệu xây dựng kiến thức chuyên môn về chủ đề trong khi vẫn duy trì các tiêu chuẩn dữ liệu tập trung khi chúng tôi tiếp tục phát triển. Vì nhóm dữ liệu sẽ luôn thay đổi và phát triển cùng với phần còn lại của tổ chức, nên bạn cần các tiêu chuẩn sẽ mở rộng theo quy mô kinh doanh.
Nếu bạn muốn tìm hiểu thêm về cách chúng tôi tiếp cận tiêu chuẩn hóa dữ liệu, hãy xem bài đăng trên blog của chúng tôi trên