paint-brush
Viết để thành công vào năm 2023: Máy học không mã để tối ưu hóa các bài viết của bạn trên HackerNoontừ tác giả@giorgiob
774 lượt đọc
774 lượt đọc

Viết để thành công vào năm 2023: Máy học không mã để tối ưu hóa các bài viết của bạn trên HackerNoon

từ tác giả Giorgio Barillà8m2023/01/18
Read on Terminal Reader

dài quá đọc không nổi

Không có Code Machine learning nào có thể giúp bạn cải thiện phạm vi tiếp cận và thành công của bài viết của mình. Để bắt đầu, bạn cần tìm những bài viết hàng đầu trên Hackernoon. Khi bạn có URL nguồn, tiêu đề và số liệu thống kê về mức độ tương tác, bạn có thể làm phong phú thêm URL của mình theo bất kỳ cách nào và mở đường cho mô hình học máy hoàn chỉnh, không cần mã để phân tích các bài báo hàng đầu hiện tại và trả về dữ liệu và dự đoán cho các bài viết trong tương lai của riêng bạn.
featured image - Viết để thành công vào năm 2023: Máy học không mã để tối ưu hóa các bài viết của bạn trên HackerNoon
Giorgio Barillà HackerNoon profile picture
0-item
1-item

Cải thiện phạm vi tiếp cận và thành công của bài viết của bạn không phải là một kỳ tích nhỏ và học máy có thể đóng một vai trò quan trọng trong quá trình của bạn.


Nếu bạn đang tạo nội dung với mục tiêu thu hút khán giả và thúc đẩy số lần nhấp, thì bài viết này là dành cho bạn. Các công cụ Máy học (ML) hiện đại giúp phân tích dữ liệu tương tác từ các bài viết trước đây để bạn có thể đưa ra quyết định sáng suốt về nội dung nào hiệu quả và nội dung nào không, mang lại lợi thế cạnh tranh cho nội dung của bạn.


Hãy cùng khám phá cách sử dụng công nghệ máy học để dự đoán mức độ thành công của các bài viết trước khi bạn nhấn nút "xuất bản".

Thu thập dữ liệu của bạn

Cho dù bạn là một nhà văn mới hay một nhà báo có kinh nghiệm, bạn có khả năng xuất bản bài báo của mình trên nhiều trang web, bao gồm cả Hackernoon thân yêu của chúng tôi.


Khi viết cho một ấn phẩm không phải của riêng bạn, bạn sẽ bỏ lỡ tất cả dữ liệu và động não mà bạn thường có khi gửi lên blog của riêng mình.


Nếu không có quyền truy cập vào dữ liệu và thông tin chi tiết từ ấn phẩm, có thể khó xác định chủ đề nào phổ biến nhất trên Hackernoon, số lượng liên kết cần thiết để hiển thị tối đa hoặc danh tiếng cần thiết cho một bài viết thành công.


Để bắt đầu, chúng ta cần tìm dữ liệu này .


Trừ khi đó là một ấn phẩm rất nhỏ, còn không thì bất kỳ công cụ SEO hiện đại nào cũng có thể cung cấp cho bạn các trang hàng đầu (hay còn gọi là các bài báo hàng đầu) cho bất kỳ trang web cụ thể nào . Hãy sử dụng Hackernoon làm ví dụ chính của chúng tôi.


Để tìm ra các bài báo hàng đầu trên Hackernoon, bạn có thể sử dụng một số thứ như SpyFu, SEMRush hoặc Ahrefs. Mỗi công cụ có số liệu riêng và sẽ phục vụ bạn tốt. Người mới bắt đầu có thể muốn dùng thử SpyFu với mức giá đầu vào phải chăng.





Tôi đã làm điều đó cho bạn và tìm thấy 3000 bài báo hàng đầu trên Hackernoon . Nếu bạn muốn tải xuống danh sách, bạn có thể làm như vậy tại đây.


Tải xuống danh sách ( Datasets for Hackernoon - Google Sheets )


Sau khi bạn có URL nguồn, tiêu đề và số liệu thống kê về mức độ tương tác, đã đến lúc chuyển sang bước tiếp theo.

Làm giàu dữ liệu của bạn

Chỉ riêng URL sẽ không cung cấp cho bạn nhiều thông tin về một bài báo và sẽ không đủ để hướng dẫn bạn cách viết để thành công vào năm 2023. Bạn cần thêm dữ liệu. Bạn cần làm giàu.


Bạn có thể làm phong phú các URL của mình theo bất kỳ cách nào, nhưng những cách có giá trị nhất có thể bao gồm các Số liệu SEO khác, chẳng hạn như số lượng từ, hồ sơ liên kết ngược và thẩm quyền của trang.


Hãy tự hỏi mình những câu hỏi này để hiểu những gì bạn đang cố gắng thoát khỏi dự đoán:

  • Bạn đang cố gắng dự đoán điều gì? Có phải là tiêu đề? Độ dài của bài viết? Số lượng từ khóa mà nó sẽ xếp hạng?
  • Dữ liệu nào bạn có sẵn ngay bây giờ? Bất kỳ dữ liệu nào có liên quan đến mục tiêu tương tác của bạn đều có thể giúp cải thiện tỷ lệ dự đoán chính xác của bạn
  • Hãy nhớ rằng khi mô hình ML của bạn đã sẵn sàng, bạn có thể sử dụng mô hình đó để dự đoán thành công trên ấn phẩm mục tiêu bất cứ khi nào bạn muốn. Mô hình dự đoán Hackernoon ngày nay sẽ phục vụ tốt cho bạn trong một thời gian dài trừ khi Hackernoon trải qua một sự thay đổi đối tượng đáng kể (hoặc một tập hợp mới các bài báo siêu thành công làm sai lệch dữ liệu).


Trong trường hợp này, mục tiêu của chúng tôi là tối ưu hóa số lượt xem trung bình mà một bài viết nhận được trên Hackernoon dựa trên tiêu đề, liên kết ngược và từ khóa.





Tôi tìm thấy tất cả dữ liệu này có sẵn trong MajesticSEO, một giải pháp phổ biến cho nghiên cứu backlink. Bạn có thể sử dụng một số lựa chọn thay thế miễn phí nếu bạn có ngân sách tiết kiệm, chẳng hạn như SEOGlass hoặc Ubersuggest. Chúng sẽ không chi tiết, nhưng bạn vẫn có thể tạo tập dữ liệu của mình.


Sau khi làm giàu, bộ dữ liệu ví dụ hiện có các tính năng:


  • Tên bài báo
  • URL
  • Số lượng liên kết ngược trung bình (nội bộ và bên ngoài)
  • Luồng trích dẫn
  • Luồng tin cậy


Bạn có thể tải xuống bộ dữ liệu phong phú miễn phí tại đây. ( Bộ dữ liệu cho Hackernoon - Google Trang tính )

Đào tạo mô hình học máy không mã của bạn

Học máy từng rất phức tạp và bạn cần một nhà khoa học dữ liệu để đưa ra bất kỳ loại mô hình đáng tin cậy nào. Ngày nay, đó không còn là trường hợp nữa.


Việc kết hợp các công nghệ mới như AutoML, ChatGPT và DALL-E2 với giao diện trực quan đã được ghi nhận vào năm 2022 với sự xuất hiện của các công cụ hỗ trợ AI. Điều này dẫn đến sự phát triển của học máy không mã.


Akkio và các công ty khác cung cấp các mô hình máy học tự động có thể được đào tạo nhanh chóng và dễ dàng mà không cần bất kỳ kiến thức nào về mã hóa hoặc khoa học dữ liệu. Với những công cụ này, bất kỳ ai trên thế giới cũng có thể tải lên bộ dữ liệu của họ và dự đoán xu hướng trong tương lai, dữ liệu dự báo và phát hiện sự bất thường.


Tiết lộ đầy đủ, tôi được liên kết với (và thích) Akkio , vì vậy tôi sẽ tiếp tục sử dụng nó với ví dụ của chúng tôi, nhưng có những công cụ khác mà bạn cũng có thể sử dụng.


Học máy không mã hiện đang được các công ty trên toàn thế giới sử dụng cho nhiều mục đích khác nhau, bao gồm phát hiện lỗi trong các sản phẩm điện tử như máy tính, phân tích phản hồi của khách hàng để cải thiện sản phẩm, hợp lý hóa quy trình nghiên cứu dược phẩm mới và dự đoán sự rời bỏ của người dùng tại thời điểm đăng ký sản phẩm .


Như đã nói, hãy quay lại nhiệm vụ: chúng tôi có một cơ sở dữ liệu phong phú gồm các bài báo về Hackernoon, với các chỉ số thành công tương đối mà chúng tôi đã đưa ra ở bước 2. Nếu các chỉ số thành công của bạn khác, bạn sẽ phải điều chỉnh cơ sở dữ liệu ban đầu của mình cho phù hợp.


Nếu bạn muốn làm theo và/hoặc đào tạo mô hình của riêng mình, Akkio và các công cụ khác được đề cập ở trên đều cung cấp các bản dùng thử miễn phí.


  1. Tải tập dữ liệu lên

    Bạn có thể tải tập dữ liệu lên Akkio thông qua tích hợp Google Trang tính, tải lên CSV trực tiếp hoặc bất kỳ tích hợp tiếp thị và CRM tích hợp nào. Bây giờ hãy làm điều đó với tải lên thủ công.





Đây là cách nền tảng Akkio sẽ xuất hiện sau khi hoàn thành:




Cùng với tất cả các cột của bạn, các tập hợp sẽ giúp bạn hiểu một số xu hướng trong dữ liệu của mình ngay từ đầu. Ví dụ: bạn có thể thấy sự phân bố của các lần nhấp SEO trong các bài viết, phác thảo rõ ràng phần lớn các bài viết nhận được ít hơn 100 lần nhấp SEO, trong khi một số có thể cực kỳ thành công.


Bạn muốn nằm trong top 5%, phải không? Vì vậy, hãy đào tạo mô hình để giúp bạn đạt được điều đó!


  1. Làm sạch bất kỳ sự khác biệt

Chuẩn bị dữ liệu phù hợp là điều cần thiết để đào tạo mô hình học máy thành công. Nếu bạn thích sử dụng Excel, nó có thể được thực hiện ở đó. Ngoài ra, Akkio cung cấp bộ công cụ chuẩn bị dữ liệu toàn diện sẽ nhắc bạn về ChatGPT.


Điều này cho phép bạn chỉ cần nhập các chỉnh sửa mong muốn của mình và bộ dữ liệu của nền tảng sẽ phản ánh chúng.


Trong ví dụ của tôi, tôi đã yêu cầu Chuẩn bị dữ liệu trò chuyện của Akkio:


  • Xóa tất cả các bài viết có ít hơn 30 lượt xem;
  • Xóa bài viết có hơn 3200 lượt xem;





Điều này là để đảm bảo chúng tôi tránh được sự bất thường trong tập dữ liệu. Chỉ có một số bài báo đạt hơn 3200 lượt xem và một số lượng rất lớn các bài báo có khả năng không liên quan có ít hơn 30. Việc loại bỏ các điểm ngoại lệ này giúp mô hình tập trung sự chú ý vào các yếu tố thúc đẩy quan trọng nhất đối với kết quả của chúng tôi.



Bạn có thể làm sạch dữ liệu khi thấy phù hợp với trường hợp sử dụng của mình. Bạn có thể cần kết hợp các cột và thay đổi định dạng của một số giá trị nhất định để có định dạng thống nhất trong toàn bộ tập hợp (ví dụ: ngày là một định dạng phổ biến).


  1. Chạy mô hình

Đối với trường hợp sử dụng này, chúng tôi muốn mô hình học máy của mình dự đoán mức độ thành công của bài viết mới dựa trên các bài viết thành công trong quá khứ. Điều này được gọi một cách thuận tiện là mô hình “dự đoán” trên nền tảng Akkio.



Một mô hình dự đoán chỉ yêu cầu bạn chọn một cột và thuật toán sẽ thực hiện phần còn lại. Tất cả những gì bạn cần làm là ngồi lại và xem mô hình tự đào tạo.


Ở cuối màn hình, bạn có thể quyết định tốc độ mà bạn muốn mô hình đi đến điểm cuối cùng. Tôi khuyên bạn nên bắt đầu với “Nhanh” (thường cần ít hơn một phút) và chuyển sang thời gian đào tạo dài hơn sau khi bạn hoàn thành bất kỳ lần lặp lại mô hình nào.




Trước khi bạn nhấp vào dự đoán, hãy kiểm tra kỹ xem bạn đã chọn đúng giá trị để dự đoán chưa. Tôi muốn dự đoán tiềm năng cho “Số nhấp chuột SEO”, vì vậy đó là mục tiêu dự đoán của tôi.


Xin lưu ý rằng Akkio và các công cụ không cần mã khác thường cung cấp nhiều mô hình máy học khác nhau. Đối với dự đoán số như ví dụ của chúng tôi, các công cụ sẽ sử dụng quy trình có tên AutoML để chọn mô hình hoạt động tốt nhất. Các nền tảng này cũng cung cấp các mô hình chuỗi thời gian và các công cụ ML khác. Tùy thuộc vào ấn phẩm bạn đang quảng cáo và nội dung bạn đang viết, bạn có thể xem xét các phương pháp lập mô hình khác.


Ví dụ: nếu bạn muốn thực hiện một số nghiên cứu chuyên sâu cho một bài viết mới, bạn có thể sử dụng các nền tảng này để phát hiện tất cả các điểm bất thường trong bộ dữ liệu khổng lồ (thậm chí có hàng triệu bản ghi, có thể đến từ Wikipedia!), dự báo xu hướng (bạn có thể xem một ví dụ về một trang web dự báo thành công của sản phẩm trên ProductHunt tại đây ). Giả sử bạn có một số dữ liệu, khả năng là vô tận.


Nếu bạn muốn tìm hiểu thêm về điều này, Akkio có một trang đầy đủ với tài liệu hỗ trợ cho tất cả các ứng dụng chính. Cảnh báo spoiler: một phần thảo luận về Phân tích tình cảm trên Twitter và một tính năng mà chỉ các nhà khoa học dữ liệu mới có thể truy cập được trong nhiều năm!


  1. Phân tích kết quả

    Khi mô hình được đào tạo xong, bạn sẽ thấy “ Báo cáo chuyên sâu”, trình bày chi tiết tất cả các mẫu cực kỳ thú vị trong dữ liệu đang thúc đẩy kết quả bạn đã chọn..



Nó sẽ cho bạn biết những yếu tố nào có liên quan đến kết quả tích cực và tiêu cực . Bạn sẽ tìm thấy rất nhiều cốm vàng ở đây. Đọc qua báo cáo thông tin chi tiết và nghiên cứu biểu đồ nhân tố thúc đẩy sẽ giúp bạn tạo chiến lược tiếp thị nội dung cho ấn phẩm của mình!


Báo cáo cũng cho thấy mức độ chính xác . Bởi vì tập dữ liệu của chúng tôi có phạm vi lớn các giá trị nhấp chuột có thể có và có trọng số lớn đối với số nhấp chuột ở mức thấp, nên chúng tôi nhận được độ chính xác thường nằm trong khoảng 55% - nhưng thống kê cần chú ý ở đây là "tắt bởi" trong số 88 lần nhấp . Điều đó thực sự khá tốt cho mục đích của chúng tôi!


Nếu mô hình của bạn không đủ chính xác, bạn thường cần lấy thêm ví dụ hoặc các cột đầu vào có liên quan hơn để cải thiện độ chính xác của mô hình - nhưng hầu như bất kỳ mô hình nào cũng sẽ có nhiều thông tin chính xác theo hướng mà bạn có thể tận dụng để cải thiện kết quả của mình.


  1. Triển khai mô hình

Bạn có thể triển khai mô hình theo nhiều cách khác nhau: API, ứng dụng web, Zapier và tích hợp trực tiếp Akkio.



Tôi khuyên bạn nên bắt đầu với ứng dụng web vì ứng dụng này không yêu cầu thiết lập và có thể được vận chuyển trực tiếp trong vòng chưa đầy 2 phút.


Ứng dụng web được tạo tự động và cho phép dự đoán hàng loạt tệp Excel hoặc CSV đã tải lên hoặc bạn có thể nhập các trường theo cách thủ công để tạo dự đoán nhấp chuột. Điều này làm cho việc sử dụng ứng dụng này cực kỳ dễ dàng để ước tính mức độ thành công của tất cả các bài viết trong tương lai cho ấn phẩm dựa trên các số liệu bạn đã xác định trong mô hình!




Bạn có thể kiểm tra nó ở đây .

Phần kết luận

Nó không tuyệt sao? Trong vòng chưa đầy 2.000 từ , chúng tôi:


  • Tạo ra một bộ dữ liệu tuyệt vời về các bài viết thành công trên Hackernoon;
  • Làm giàu dữ liệu với dữ liệu từ các công cụ SEO như SpyFu và MajesticSEO;
  • Tự động xử lý bộ dữ liệu bằng GPT-3;
  • Đã gửi một ứng dụng trực tiếp có thể dự đoán mức độ thành công của các bài báo trong tương lai dựa trên các chỉ số mà chúng tôi đã xác định.


Một thứ mà trước đây yêu cầu phải có kỹ sư dữ liệu, nhà phân tích và chuyên gia máy học, giờ đây đã có sẵn cho bất kỳ ai có máy tính .


Chào mừng bạn đến với cuộc cách mạng AI và nó sẽ ngày càng tốt hơn!


Trong các bài viết tới, tôi sẽ giải thích nhiều ứng dụng hơn nữa cho tiếp thị, bán hàng và dịch vụ khách hàng. Học máy rất hấp dẫn và có thể giúp bạn tiết kiệm hàng nghìn đô la (và hàng giờ!) mỗi tuần.


Hãy thử với bộ dữ liệu của riêng bạn. Tôi có thể hứa rằng nó cực kỳ thú vị, dễ dàng, hiệu quả và bạn sẽ bị ấn tượng bởi kết quả cuối cùng! Hãy thử nó cho chính mình bây giờ .