paint-brush
Những thông tin chi tiết về Google Maps này được phát hiện bởi một nhà khoa học dữ liệu là không thể tin đượctừ tác giả@shauryauppal
923 lượt đọc
923 lượt đọc

Những thông tin chi tiết về Google Maps này được phát hiện bởi một nhà khoa học dữ liệu là không thể tin được

từ tác giả Shaurya Uppal4m2023/01/11
Read on Terminal Reader

dài quá đọc không nổi

Là một nhà khoa học dữ liệu, tôi thấy việc cá nhân hóa tìm kiếm và xếp hạng là một thách thức phức tạp và thú vị. Google Maps nhận ra vị trí của tôi và hiển thị năm vị trí phổ biến nhất được những người trước đó đã nhập “ei” truy cập hoặc nhấp vào. Tất cả các kết quả đều ở gần vị trí của tôi (xem Hình 1)
featured image - Những thông tin chi tiết về Google Maps này được phát hiện bởi một nhà khoa học dữ liệu là không thể tin được
Shaurya Uppal HackerNoon profile picture
0-item


Google Maps là một sản phẩm tuyệt vời và nó mang lại rất nhiều giá trị cho cuộc sống của mọi người. Hôm nay, tôi muốn chia sẻ quan điểm của mình về cách ai đó có thể xây dựng một sản phẩm như thế này từ đầu.


Mặc dù đúng là tìm kiếm liên quan đến cả kỹ thuật và khoa học dữ liệu, nhưng nhiều công ty có thể đánh giá thấp tầm quan trọng của khoa học dữ liệu trong tìm kiếm. Tìm kiếm không chỉ là xây dựng cơ sở hạ tầng kỹ thuật để xử lý và trả về kết quả cho một truy vấn nhất định mà còn là hiểu và dự đoán nhu cầu cũng như sở thích của người dùng và sử dụng dữ liệu để điều chỉnh trải nghiệm tìm kiếm cho từng người dùng.


Là một nhà khoa học dữ liệu, tôi thấy việc cá nhân hóa tìm kiếm và xếp hạng là một thách thức phức tạp và thú vị. Chúng tôi thu hút sự quan tâm của người dùng bằng cách kiểm tra: truy vấn tìm kiếm của người dùng, lịch sử tìm kiếm trước đây và dữ liệu nhấp chuột.


Bản tin này sẽ trả lời tất cả các câu hỏi của bạn về:


  • Dữ liệu nào được yêu cầu?
  • Cần xếp hạng và mức độ liên quan trong Bản đồ?
  • Tại sao một kết quả cụ thể xuất hiện?


Tuyên bố miễn trừ trách nhiệm: Vui lòng DM trước khi đăng lại chiến lược này trên các nền tảng khác, vì nó hoàn toàn là bản gốc đối với tôi và không được sao chép. Tôi không xác nhận bất kỳ thương hiệu nào; các ví dụ được chia sẻ chỉ là để học hỏi. Bất kỳ ai cũng có thể tạo bản đồ của riêng mình từ đầu bằng cách sử dụng khái niệm này.

Ai muốn mình tư vấn thì liên hệ TẠI ĐÂY

Tại sao kết quả này và làm thế nào?

Những gì chúng tôi đang tìm kiếm: Tôi sống ở Gurugram và đang tìm kiếm “Tháp Eiffel, Paris”

Hãy bắt đầu nhập “EI” trên Bản đồ và phân tích. Chúng tôi đã nhận được 5 kết quả hàng đầu được liệt kê bên dưới từ truy vấn.

Hình 1 Phân tích tìm kiếm


Tại sao chỉ có năm kết quả? Tìm kiếm là tất cả về xếp hạng và mức độ liên quan. Mục đích của thuật toán là mang lại cho người dùng kết quả mong muốn với độ dài truy vấn tối thiểu. Mặt khác, nhiều ngữ cảnh hơn cho thuật toán sẽ tốt hơn so với nỗ lực cuộn qua một danh sách dài các kết quả được trả về bởi truy vấn “ei”.


Hình1. Phân tích tìm kiếm


Lý do cho Kết quả này: Mức độ phổ biến và các tín hiệu theo ngữ cảnh được kích hoạt tại đây. Google Maps nhận ra vị trí của tôi và hiển thị năm vị trí phổ biến nhất được truy cập hoặc nhấp vào bởi những người trước đây đã nhập "ei". Tất cả các kết quả đều ở gần vị trí của tôi (xem Hình 1). Truy vấn “eif” đặt Tháp Eiffel ở vị trí thứ 3 vì điểm phổ biến cao hơn. (xem Hình 2)


Hình 2 Mức độ phổ biến và Tìm kiếm dựa trên khoảng cách

Làm cách nào để xây dựng tìm kiếm dựa trên vị trí của người dùng?

Những gì chúng ta có?


  • Chúng tôi biết vị trí của người dùng
  • Vị trí của tất cả các Thực thể đã đăng ký — Cửa hàng, Quán cà phê, Nhà hàng, Khách sạn, v.v.

Cách tiếp cận ngây thơ

Sử dụng công thức Haversine, tính toán khoảng cách giữa Vĩ độ/Kinh độ của người dùng và các vị trí khác trong thành phố hoặc mã zip. (xem Hình 3)


Hình 3 Công thức Haversine


Ở cấp độ GMaps, nơi có hàng tỷ thực thể và hàng triệu người dùng, phương pháp này không thể mở rộng.

Cách tiếp cận thông minh hơn với DS Intelligence

  • Hãy để chúng tôi nói rằng chúng tôi đang thực hiện xây dựng tìm kiếm này chỉ cho khu vực Bangalore.
  • Chúng tôi nhóm mọi thực thể đã đăng ký — chia toàn bộ khu vực thành các cụm thực thể con nhỏ hơn, chẳng hạn như 50. (xem Hình 4)

Hình.4 Bangalore thành các cụm thực thể con


  • Khi Người dùng trực tuyến, chỉ cần kiểm tra Lat-Long và xếp hạng các thực thể dựa trên mức độ phổ biến trong cụm. Cách tiếp cận này bổ sung cả hai yếu tố dựa trên Khoảng cách và Mức độ phổ biến vào kết quả tìm kiếm của chúng tôi.

tái bút Một số bạn có thể hỏi liệu điều này có thể được thực hiện trong Tìm kiếm đàn hồi hay không. Kiểm tra Phân loại địa lý

Hình 5 ES Geo-Sắp xếp

Làm cách nào để tìm kiếm theo ngữ cảnh hoặc được cá nhân hóa hơn?

Để làm cho tìm kiếm theo ngữ cảnh hoặc được cá nhân hóa hơn, bạn có thể cân nhắc sử dụng các phương pháp tiếp cận dựa trên dữ liệu có tính đến nhu cầu hoặc sở thích cụ thể của người dùng. Ví dụ: nếu Mr. Wolf đang tìm kiếm nhà hàng và đã thực hiện nhiều truy vấn liên quan đến nhà hàng trong một khoảng thời gian ngắn hoặc trong cùng một phiên, thì bạn có thể ưu tiên hiển thị cho anh ấy các kết quả được cá nhân hóa theo vị trí của anh ấy và cũng xem xét lịch sử tìm kiếm trước đây của anh ấy. Điều này có thể liên quan đến việc xếp hạng các nhà hàng gần anh ấy cao hơn trong kết quả tìm kiếm và giới thiệu cho anh ấy các lựa chọn phù hợp với sở thích hoặc sở thích của anh ấy hoặc những lần anh ấy ghé thăm các địa điểm khác nhau trước đây.


Bằng cách sử dụng các phương pháp tiếp cận dựa trên dữ liệu, bạn có thể cung cấp cho Mr. Wolf các kết quả tìm kiếm được nhắm mục tiêu và phù hợp hơn thay vì chỉ dựa vào các tiêu chí phổ biến hoặc dựa trên khoảng cách.

Ai đó có thể hỏi, Shaurya, bạn đã nói về khía cạnh phổ biến trong tìm kiếm nhưng một số cách khác nhau để xác định một vị trí là phổ biến là gì?

  • Số lượt xem/lần nhấp trong 1 tháng qua
  • Số người đã ghé thăm một địa điểm trong 1 tháng qua
  • Đa nền tảng proxy: Google Pay Phân tích giao dịch, một cửa hàng bán lẻ được coi là phổ biến nếu khối lượng giao dịch cao

Đề xuất từ các tìm kiếm được lưu trong bộ nhớ cache trước đây

Không có mô hình Khoa học dữ liệu nào có thể đánh bại sự đơn giản của dữ liệu lịch sử được trình bày rõ ràng (xem Hình 6) với các thuật toán lưu vào bộ nhớ đệm: LFU (Ít được sử dụng thường xuyên nhất) hoặc LFU với Lão hóa động (kiểm tra liên kết bên dưới để biết giải thích chi tiết về LFU với Lão hóa động).


Kiểm tra Blog của tôi tại đây: https://shauryauppal.medium.com/thinking-data-strategies-in-fintech-universe-building-payments-recommendation-system-for-google-95c746e3dd0e

Hình 6. Tìm kiếm trong bộ nhớ cache

Tóm tắt phân tích của chúng tôi

1. Chúng ta đã thảo luận tại sao 5 kết quả được hiển thị trong danh sách kết quả tìm kiếm

2. Xếp hạng kết quả dựa trên Mức độ phổ biến + Tính điểm khoảng cách

3. Sắp xếp địa lý trong tìm kiếm đàn hồi

4. Cá nhân hóa trong Tìm kiếm dựa trên danh mục truy vấn lịch sử

5. Làm thế nào để bạn xác định một thực thể là một vị trí phổ biến?

6. Các đề xuất dựa trên bộ nhớ đệm của các truy vấn tìm kiếm trước đây và các địa điểm đã ghé thăm


Cảm ơn mọi người đã trao cho tôi giải thưởng này


Noonies Tech 2022


Kết nối, Theo dõi hoặc Xác nhận tôi trên LinkedIn nếu bạn thấy bài đọc này hữu ích. Để tìm hiểu thêm về tôi, hãy truy cập: Tại đây


Tôi đang tìm kiếm một vị trí Trưởng nhóm thú vị / Nhà khoa học dữ liệu cấp cao: Nếu bạn có điều gì đó cho tôi, hãy kết nối tại [email protected]


Đăng lại từ Bản tin của tôi: Tại đâyTại đây