paint-brush
Có gì bên trong vụ rò rỉ API tìm kiếm lớn gần đây của Google?từ tác giả@viceasytiger
2,189 lượt đọc
2,189 lượt đọc

Có gì bên trong vụ rò rỉ API tìm kiếm lớn gần đây của Google?

từ tác giả Vik Bogdanov9m2024/06/11
Read on Terminal Reader

dài quá đọc không nổi

Bí mật xếp hạng của Google bị rò rỉ! Hóa ra số lần nhấp chuột, quyền hạn tên miền và thậm chí cả lượt đề cập đều quan trọng hơn những gì họ cho phép. Doanh nghiệp cần tập trung vào nội dung chất lượng cao, sự tương tác của người dùng và liên kết ngược từ các nguồn đáng tin cậy. Thân thiện với thiết bị di động bây giờ là điều cần thiết. Nắm bắt tương lai của SEO: nội dung giàu thông tin VÀ hấp dẫn.
featured image - Có gì bên trong vụ rò rỉ API tìm kiếm lớn gần đây của Google?
Vik Bogdanov HackerNoon profile picture
0-item

Trong một tin chấn động đối với thế giới SEO, một vụ rò rỉ vào ngày 5 tháng 5 năm 2024 đã tiết lộ những bí mật được bảo vệ chặt chẽ về thứ hạng tìm kiếm của Google. Hơn 14.000 yếu tố xếp hạng đã vô tình được tiết lộ từ các tài liệu nội bộ của Google, làm sáng tỏ cách các trang web thực sự leo lên bậc thang tìm kiếm. Được các chuyên gia SEO xác thực, vụ rò rỉ này xác nhận sự nghi ngờ từ lâu về quyền lực của cơ quan quản lý tên miền, đồng thời khiến mọi người ngạc nhiên về sức nặng mà Google đặt lên các lượt nhấp chuột và thậm chí cả những lần đề cập đến thương hiệu của bạn trực tuyến. Nhưng ngoài những thay đổi chiến lược, vụ rò rỉ còn đặt ra những câu hỏi liên quan đến quyền riêng tư của người dùng và lượng dữ liệu khổng lồ mà Google thu thập thông qua Chrome. Bài viết đi sâu vào hậu quả của vụ rò rỉ này, khám phá cách các doanh nghiệp có thể định hình lại chiến lược SEO của họ và ý nghĩa đạo đức của các hoạt động xử lý dữ liệu của Google.


Ngày 5 tháng 5 năm 2024, đánh dấu sự rò rỉ đầu tiên của bộ sưu tập toàn diện nhất về các yếu tố xếp hạng API Tìm kiếm của Google trong lịch sử công cụ tìm kiếm – một khoảnh khắc lịch sử thực sự mà chúng ta có thể chưa từng thấy nếu Erfan Azimi, người sáng lập & Giám đốc điều hành của một công ty SEO, đã không phát hiện ra các tài liệu của Google bị phát hành nhầm trên Github vào ngày 27 tháng 3 năm 2024 và bị quên xóa. Điều trớ trêu là chúng được xuất bản theo giấy phép Apache 2.0, cho phép bất kỳ ai truy cập tài liệu đều có thể sử dụng, chỉnh sửa và phân phối chúng. Do đó, việc chia sẻ tài liệu với hai trong số những chuyên gia SEO uy tín nhất, Rand Fishkin và Mike King – bước tiếp theo mà Erfan Azimi thực hiện sau khi phát hiện ra vụ rò rỉ – nằm trong ranh giới pháp lý của giấy phép. Cả hai đều công bố các tài liệuphân tích kèm theo vào ngày 27/5.


Mặc dù ban đầu né tránh các câu hỏi về tính xác thực của tài liệu, nhưng cuối cùng Google cũng thừa nhận tài liệu đó là thật.


Hơn 2.500 tài liệu bị rò rỉ hiển thị 14.014 thuộc tính (tính năng API) hoặc "yếu tố xếp hạng" từ API kho nội dung của Google Tìm kiếm. Nói cách khác, chúng cho chúng ta thấy dữ liệu nào Google thực sự thu thập thay vì cách Google diễn giải dữ liệu đó.




Thông tin bị rò rỉ có giá trị đáng kể đối với bất kỳ công ty nào muốn tăng lưu lượng truy cập không phải trả tiền và chuyển đổi doanh số từ tiếp thị tìm kiếm của Google. Nó cung cấp cái nhìn sâu sắc độc đáo về các yếu tố ảnh hưởng đến thứ hạng tìm kiếm của Google, cho phép các doanh nghiệp định hình lại chiến lược SEO của mình cho phù hợp.


Mặt khác, vụ rò rỉ nêu bật sự thiếu minh bạch của Google về cách thu thập và sử dụng dữ liệu người dùng trong các thuật toán tìm kiếm, đồng thời làm dấy lên những lo ngại về đạo đức và quyền riêng tư về mức độ cũng như ý nghĩa của việc thu thập dữ liệu của gã khổng lồ tìm kiếm.

Tìm hiểu tác động của việc rò rỉ tài liệu API tìm kiếm của Google đối với SEO: Những khám phá chính và ý kiến chuyên gia

Navboost là một trong những tín hiệu xếp hạng quan trọng nhất của Google

Navboost là thuật toán xếp hạng của Google được tiết lộ trong phiên tòa chống độc quyền của công ty với Bộ Tư pháp Hoa Kỳ. Nó nâng cao kết quả tìm kiếm cho các truy vấn điều hướng bằng cách sử dụng nhiều tín hiệu khác nhau như số lần nhấp chuột của người dùng để xác định kết quả phù hợp nhất. Navboost giữ lại các lần nhấp trước đây cho các truy vấn cách đây tối đa 13 tháng và phân biệt các kết quả dựa trên bản địa hóa và loại thiết bị (thiết bị di động hoặc máy tính để bàn). Tín hiệu xếp hạng này rất quan trọng để các chuyên gia SEO hiểu và tối ưu hóa vì nó có thể tác động đáng kể đến khả năng hiển thị của trang web trong kết quả tìm kiếm.

Thực sự, số nhấp chuột là một tín hiệu xếp hạng chính

Google đã phủ nhận trong nhiều năm rằng các nhấp chuột thuộc về yếu tố xếp hạng chính. Các đại diện của nó, bao gồm cả Gary Illyes, đã liên tục nhấn mạnh rằng tỷ lệ nhấp (CTR) là một "tín hiệu rất nhiễu" và việc sử dụng các nhấp chuột trực tiếp trong bảng xếp hạng sẽ gặp vấn đề do có khả năng bị thao túng. Họ đã giải thích rằng mặc dù dữ liệu nhấp chuột được sử dụng cho mục đích đánh giá và thử nghiệm nhằm đánh giá những thay đổi trong thuật toán tìm kiếm nhưng nó không phải là yếu tố chính trong việc xác định thứ hạng tìm kiếm.


Các tài liệu bị rò rỉ chứng minh điều ngược lại. Điều quan trọng là một trang web có thể tạo ra bao nhiêu cú nhấp chuột. Bạn càng thực hiện tối ưu hóa trên trang và tiếp thị nội dung liên tục thì bạn càng thu hút được nhiều lưu lượng truy cập, dẫn đến nhiều nhấp chuột hơn, thứ hạng cao hơn và tỷ lệ chuyển đổi cao hơn.

Cơ quan quản lý miền quan trọng mặc dù các quan chức của Google luôn phủ nhận điều đó

Đại diện của Google đã liên tục định hướng sai và đánh lừa chúng tôi về cách hệ thống của họ vận hành nhằm mục đích tác động đến hành vi SEO. Mặc dù các tuyên bố công khai của họ có thể không phải là những lời nói dối có chủ ý, nhưng chúng được thiết kế để đánh lừa những kẻ gửi thư rác tiềm năng—và nhiều chuyên gia SEO hợp pháp—bằng cách che giấu cách các kết quả tìm kiếm có thể bị ảnh hưởng. Gary Ilyes, một nhà phân tích của Nhóm Tìm kiếm Google, đã nhắc lại quan điểm này nhiều lần . Anh ấy không đơn độc; John Mueller, Nhà phân tích xu hướng quản trị trang web cấp cao của Google và trưởng nhóm Quan hệ tìm kiếm, từng tuyên bố rằng họ không có điểm thẩm quyền trang web.


Tuy nhiên, như vụ rò rỉ dữ liệu cho thấy, Google có biện pháp đo lường thẩm quyền tên miền tổng thể. Là một phần của Tín hiệu chất lượng nén được lưu trữ trên cơ sở mỗi tài liệu, Google tính toán một tính năng có tên là "siteAuthority". Theo Mike King , Người sáng lập và Giám đốc điều hành của iPullRank, mặc dù cách tính toán và ứng dụng cụ thể của biện pháp này trong các chức năng tính điểm xuôi dòng vẫn chưa rõ ràng nhưng giờ đây chúng tôi đã biết chắc chắn rằng cơ quan quản lý tên miền của Google tồn tại và được sử dụng trong hệ thống xếp hạng Q*.

Google đưa một số trang web vào danh sách trắng và ưu đãi cho chúng trong kết quả tìm kiếm

Vụ rò rỉ API tìm kiếm của Google gần đây đã tiết lộ sự tồn tại của danh sách trắng được sử dụng để đảm bảo chất lượng và độ tin cậy của thông tin, đặc biệt đối với các chủ đề nhạy cảm như sức khỏe và tin tức, nơi thông tin sai lệch có thể ảnh hưởng nghiêm trọng đến sức khỏe cộng đồng.


Trong những thời điểm quan trọng như đại dịch COVID-19, Google đã sử dụng danh sách trắng để ngăn chặn thông tin sai lệch và ưu tiên các nguồn đáng tin cậy. Điều này giúp quản lý sự lan truyền thông tin sai lệch về vi-rút, phương pháp điều trị và vắc-xin, đảm bảo người dùng nhận được thông tin chính xác và đáng tin cậy.


Các trang web có trong danh sách trắng này đã chứng tỏ được thẩm quyền, độ tin cậy và hồ sơ theo dõi nhất quán về việc cung cấp thông tin đáng tin cậy. Các tiêu chí để đưa vào rất nghiêm ngặt, tập trung vào độ chính xác và độ tin cậy.


Tuy nhiên, việc sử dụng danh sách trắng cũng làm dấy lên lo ngại về tính minh bạch và công bằng, khi các nhà phê bình đặt câu hỏi về khả năng thiên vị và các tiêu chí lựa chọn.


Đối với SEO, điều này nhấn mạnh tầm quan trọng của việc xây dựng uy tín và độ tin cậy. Các trang web muốn được đưa vào danh sách trắng phải tập trung vào việc báo cáo chính xác và tuân thủ các tiêu chuẩn biên tập cao, bao gồm các chính sách chỉnh sửa rõ ràng và thông tin liên hệ.


Bất chấp sự thận trọng của Google trong việc đưa ra các giả định dựa trên thông tin bị rò rỉ, thông tin chi tiết về danh sách trắng nhấn mạnh vai trò của chúng trong việc quản lý thông tin và duy trì chất lượng kết quả tìm kiếm. Điều này nhấn mạnh tầm quan trọng của độ tin cậy, độ chính xác và sự tin cậy trong bối cảnh thông tin kỹ thuật số.

Danh mục trang web bị giới hạn trong kết quả của Google

Các tài liệu bị rò rỉ cho thấy Google có thể giới hạn sự hiện diện của nhiều danh mục trang web khác nhau, chẳng hạn như blog công ty, trang thương mại và trang web cá nhân, trong kết quả tìm kiếm cho các truy vấn cụ thể. Cách tiếp cận này nhằm mục đích đa dạng hóa các loại nguồn được trình bày cho người dùng, đảm bảo phạm vi quan điểm rộng hơn và giảm sự thống trị của bất kỳ loại trang web nào.


Ví dụ: Google có thể quyết định rằng chỉ một số lượng blog du lịch hoặc trang web du lịch thương mại nhất định mới xuất hiện trong kết quả cho một truy vấn tìm kiếm liên quan đến du lịch nhất định. Hạn chế này giúp cân bằng kết quả tìm kiếm, cung cấp cho người dùng sự kết hợp thông tin từ nhiều loại nguồn khác nhau. Nó giúp kết quả tìm kiếm không bị bão hòa quá mức với một danh mục, chẳng hạn như blog cá nhân hoặc trang web thương mại, những danh mục không phải lúc nào cũng cung cấp thông tin đa dạng hoặc đáng tin cậy nhất.


Chiến lược này nêu bật cam kết của Google trong việc mang lại trải nghiệm tìm kiếm cân bằng và đa dạng. Bằng cách kiểm soát sự kết hợp của các loại trang web trong kết quả tìm kiếm, Google nhằm mục đích nâng cao chất lượng và mức độ liên quan của thông tin được trình bày cho người dùng, đảm bảo họ nhận được cái nhìn toàn diện về nội dung có sẵn.

Việc đề cập đến các thực thể có thể ảnh hưởng đến thứ hạng tìm kiếm tương tự như các liên kết

Vụ rò rỉ API tìm kiếm của Google đã cung cấp những hiểu biết sâu sắc hấp dẫn về cách đề cập đến các thực thể, chẳng hạn như tên hoặc công ty, có thể ảnh hưởng đến thứ hạng tìm kiếm tương tự như các liên kết ngược truyền thống. Đề cập đề cập đến các trường hợp tên hoặc cụm từ được tham chiếu trên web mà không nhất thiết phải được liên kết. Những đề cập này có thể là tín hiệu quan trọng đối với thuật toán của Google, cho biết mức độ liên quan và quyền hạn của một thực thể cụ thể.


Các tài liệu bị rò rỉ cho thấy Google theo dõi những đề cập này và có khả năng sử dụng chúng để đánh giá mức độ nổi bật và độ tin cậy của các thực thể. Ví dụ: việc đề cập thường xuyên đến một thương hiệu hoặc cá nhân trên nhiều trang web có uy tín khác nhau có thể tác động tích cực đến thứ hạng tìm kiếm của họ, giống như cách các liên kết ngược từ các trang web có thẩm quyền thúc đẩy SEO. Điều này cho thấy rằng thuật toán của Google không chỉ xem xét các liên kết trực tiếp mà còn xem xét sự hiện diện và thảo luận tổng thể của một thực thể trên web.

Dữ liệu luồng nhấp chuột từ Chrome có khả năng tác động đến thứ hạng không phải trả tiền thông qua các nhấp chuột có trả tiền nhưng đặt ra câu hỏi về quyền riêng tư

Dữ liệu luồng nhấp chuột của Chrome đề cập đến các bản ghi chi tiết về tương tác và hành vi của người dùng trong trình duyệt Google Chrome, bao gồm những liên kết nào được nhấp vào, thời gian người dùng ở lại trên một trang và đường dẫn điều hướng của họ. Dữ liệu này cung cấp cho Google nguồn thông tin phong phú về sở thích và hành vi của người dùng. Dữ liệu này có thể được tận dụng để tinh chỉnh các thuật toán tìm kiếm và cải thiện mức độ liên quan của kết quả tìm kiếm.




Ví dụ,


nếu nhiều người dùng nhấp vào một liên kết cụ thể và dành nhiều thời gian trên trang đó, điều đó sẽ báo hiệu cho Google rằng trang đó có thể có chất lượng cao và mức độ liên quan, từ đó nâng cao thứ hạng của trang đó trong kết quả tìm kiếm.


Khám phá này có ý nghĩa sâu sắc đối với các chiến lược SEO. Nó gợi ý rằng số liệu tương tác của người dùng được ghi lại thông qua Chrome có thể ảnh hưởng đáng kể đến thứ hạng tìm kiếm ngoài các phương pháp SEO truyền thống như tối ưu hóa từ khóa và xây dựng liên kết ngược . Các chuyên gia SEO nên tập trung vào việc tạo nội dung thu hút nhấp chuột và duy trì sự quan tâm của người dùng, đảm bảo thời gian tải nhanh, điều hướng dễ dàng và nội dung hấp dẫn, có giá trị. Bằng cách nâng cao trải nghiệm tổng thể của người dùng, các trang web có thể tận dụng dữ liệu luồng nhấp chuột của Chrome để cải thiện khả năng hiển thị và hiệu suất của chúng trong kết quả tìm kiếm của Google.


Tuy nhiên, khám phá này cũng đặt ra câu hỏi về mức độ thu thập dữ liệu người dùng và cách nó được sử dụng ngoài việc chỉ cải thiện kết quả tìm kiếm.


Trên hết, việc hiểu các yếu tố xếp hạng như dữ liệu luồng nhấp chuột có thể cho phép các tác nhân độc hại thao túng kết quả tìm kiếm bằng cách tăng số lần nhấp chuột một cách giả tạo trên một số trang web nhất định. Điều này có thể khiến người dùng gặp phải nội dung gây hiểu lầm hoặc có hại và gây rủi ro lớn cho quyền riêng tư.

Nội dung chất lượng được quảng bá đến đúng đối tượng luôn chiến thắng

Nội dung chất lượng và chiến lược liên kết ngược được thiết lập tốt có thể thúc đẩy lưu lượng truy cập và giúp tăng thứ hạng web. Mike King nói: "Sau khi xem xét các tính năng mang lại lợi thế cho Google, khá rõ ràng rằng việc tạo ra nội dung tốt hơn và quảng bá nội dung đó tới những khán giả mà nó gây được tiếng vang sẽ mang lại tác động tốt nhất cho các biện pháp đó."

Lưu lượng truy cập giảm đáng kể có thể báo hiệu sự cố đối với thuật toán của Google

Mặc dù lập trường chính thức của Google thường nhấn mạnh rằng việc mất lưu lượng truy cập không dẫn đến hình phạt, nhưng các tài liệu bị rò rỉ và các phân tích khác nhau của chuyên gia SEO lại cho thấy điều ngược lại.


Lưu lượng truy cập giảm đáng kể thực sự có thể báo hiệu các vấn đề với thuật toán của Google. Ví dụ: các tài liệu bị rò rỉ nêu bật các khái niệm như "suy giảm nội dung" và "nhấp chuột tốt cuối cùng", ngụ ý rằng lưu lượng truy cập và mức độ tương tác của người dùng giảm liên tục có thể tác động tiêu cực đến thứ hạng. Điều này cho thấy rằng nếu lưu lượng truy cập của trang web giảm đáng kể—chẳng hạn từ 10 nghìn xuống 2 nghìn người dùng mới mỗi tháng—thuật toán của Google có thể hiểu điều này là sự giảm mức độ liên quan hoặc chất lượng nội dung, có khả năng dẫn đến hình phạt hoặc giảm khả năng hiển thị trong kết quả tìm kiếm.

Tìm kiếm có thương hiệu giữ giá trị đáng kể

Các tài liệu bị rò rỉ cũng nhấn mạnh tầm quan trọng của việc tìm kiếm thương hiệu, tiết lộ rằng khi người dùng tìm kiếm cụ thể một thương hiệu, nó có thể nâng cao đáng kể thứ hạng của thương hiệu đó trong kết quả tìm kiếm của Google. Điều này nhấn mạnh giá trị của việc xây dựng sự hiện diện và nhận diện thương hiệu mạnh mẽ. Do đó, chiến lược SEO nên bao gồm các nỗ lực nâng cao khả năng hiển thị thương hiệu và khuyến khích tìm kiếm thương hiệu trực tiếp. Điều này có thể đạt được thông qua tiếp thị nội dung nhất quán và chất lượng cũng như thu hút khán giả trên nhiều nền tảng khác nhau.

Hiệu suất di động phải là ưu tiên hàng đầu

Dựa trên mọi thông tin trong các tài liệu này và thông báo gần đây về việc Google hủy lập chỉ mục các trang web không hoạt động trên thiết bị di động, chúng tôi phải xem xét hiệu suất trên thiết bị di động một cách nghiêm túc. Nếu trang web của bạn hoạt động kém trên thiết bị di động thì trang web đó sẽ bị hủy lập chỉ mục vào ngày 5 tháng 7 năm 2024.

Ý nghĩa rò rỉ API tìm kiếm của Google đối với chiến lược tiếp thị kỹ thuật số

Suy ngẫm về những phát hiện này, có thể thấy rõ một số điều chỉnh mang tính chiến lược. Thứ nhất, có khái niệm cân bằng tâm lý không nhấp chuột. Trước đây, email của chúng tôi đã cung cấp tất cả thông tin cần thiết để tránh phải nhấp chuột thêm. Tuy nhiên, với sự hiểu biết rằng dữ liệu luồng nhấp chuột của Chrome có thể tác động đến thứ hạng, chúng tôi có thể điều chỉnh chiến lược email của mình để khuyến khích nhấp chuột vào bài đăng trên blog của mình. Sự thay đổi này đảm bảo rằng các tương tác của người dùng với trang web của chúng tôi được ghi lại, có khả năng nâng cao khả năng hiển thị tìm kiếm của chúng tôi.


Một trục chiến lược khác liên quan đến việc tập trung vào các liên kết có lưu lượng truy cập cao. Trọng tâm bây giờ là đảm bảo các liên kết ngược từ các nguồn có lưu lượng truy cập cao, có uy tín thay vì nhiều nguồn nhỏ hơn. Các nguồn có lưu lượng truy cập cao có nhiều khả năng được thuật toán của Google công nhận là chỉ số về độ tin cậy và mức độ liên quan, do đó ảnh hưởng tích cực đến thứ hạng của chúng tôi.


Tạo ra nhu cầu về nội dung trực quan cũng rất quan trọng. Việc sản xuất video và hình ảnh hấp dẫn có thể tạo ra kết quả tìm kiếm có lợi hơn. Nội dung trực quan có xu hướng thu hút nhiều tương tác người dùng hơn và thời gian tương tác lâu hơn – các số liệu có giá trị được dữ liệu luồng nhấp chuột của Chrome ghi lại.


Việc đánh giá lại các hoạt động liên kết ngoài cũng đã trở nên cần thiết. Trước đây được coi là một tín hiệu SEO tích cực, việc liên kết ngoài giờ đây được hiểu là có liên quan đến điểm spam. Khám phá này yêu cầu chúng tôi đánh giá lại giá trị của việc liên kết ngoài và điều chỉnh các phương pháp của mình để tránh các hình phạt có thể xảy ra.


Cuối cùng, việc tập trung vào việc đề cập đến các liên kết đang nổi lên như một chiến lược mới. Ưu tiên đề cập đến thương hiệu của bạn và các thực thể chính trong nội dung chất lượng cao trên web có thể có tác động tương tự như việc xây dựng liên kết truyền thống. Cách tiếp cận này thúc đẩy sự công nhận của Google đối với các đề cập đến thực thể trong thuật toán xếp hạng của họ.


Tóm lại, những hiểu biết sâu sắc từ vụ rò rỉ API Google Tìm kiếm nêu bật tầm quan trọng của việc tạo và phân phối nội dung nhất quán và chất lượng, mức độ tương tác của người dùng cũng như vai trò đa sắc thái của các phương pháp SEO khác nhau như xây dựng liên kết và tìm kiếm có thương hiệu. Việc điều chỉnh chiến lược của bạn để phù hợp với những phát hiện này có thể nâng cao thứ hạng tìm kiếm và sự hiện diện kỹ thuật số tổng thể của bạn. Tuy nhiên, việc quá tin tưởng vào thông tin rò rỉ này mà không xem xét đến bản chất ngày càng phát triển của thuật toán của Google có thể gặp rủi ro.


Và bạn nghĩ gì về điều này?


Đừng quên xem phạm vi đưa tin của tôi về Tổng quan về AI của Google và tác động của chúng đối với tiếp thị kỹ thuật số.