Google Maps là một sản phẩm tuyệt vời và nó mang lại rất nhiều giá trị cho cuộc sống của mọi người. Hôm nay, tôi muốn chia sẻ quan điểm của mình về cách ai đó có thể xây dựng một sản phẩm như thế này từ đầu.
Mặc dù đúng là tìm kiếm liên quan đến cả kỹ thuật và khoa học dữ liệu, nhưng nhiều công ty có thể đánh giá thấp tầm quan trọng của khoa học dữ liệu trong tìm kiếm. Tìm kiếm không chỉ là xây dựng cơ sở hạ tầng kỹ thuật để xử lý và trả về kết quả cho một truy vấn nhất định mà còn là hiểu và dự đoán nhu cầu cũng như sở thích của người dùng và sử dụng dữ liệu để điều chỉnh trải nghiệm tìm kiếm cho từng người dùng.
Là một nhà khoa học dữ liệu, tôi thấy việc cá nhân hóa tìm kiếm và xếp hạng là một thách thức phức tạp và thú vị. Chúng tôi thu hút sự quan tâm của người dùng bằng cách kiểm tra: truy vấn tìm kiếm của người dùng, lịch sử tìm kiếm trước đây và dữ liệu nhấp chuột.
Bản tin này sẽ trả lời tất cả các câu hỏi của bạn về:
Tuyên bố miễn trừ trách nhiệm: Vui lòng DM trước khi đăng lại chiến lược này trên các nền tảng khác, vì nó hoàn toàn là bản gốc đối với tôi và không được sao chép. Tôi không xác nhận bất kỳ thương hiệu nào; các ví dụ được chia sẻ chỉ là để học hỏi. Bất kỳ ai cũng có thể tạo bản đồ của riêng mình từ đầu bằng cách sử dụng khái niệm này.
Ai muốn mình tư vấn thì liên hệ TẠI ĐÂY
Những gì chúng tôi đang tìm kiếm: Tôi sống ở Gurugram và đang tìm kiếm “Tháp Eiffel, Paris”
Hãy bắt đầu nhập “EI” trên Bản đồ và phân tích. Chúng tôi đã nhận được 5 kết quả hàng đầu được liệt kê bên dưới từ truy vấn.
Hình 1 Phân tích tìm kiếm
Tại sao chỉ có năm kết quả? Tìm kiếm là tất cả về xếp hạng và mức độ liên quan. Mục đích của thuật toán là mang lại cho người dùng kết quả mong muốn với độ dài truy vấn tối thiểu. Mặt khác, nhiều ngữ cảnh hơn cho thuật toán sẽ tốt hơn so với nỗ lực cuộn qua một danh sách dài các kết quả được trả về bởi truy vấn “ei”.
Lý do cho Kết quả này: Mức độ phổ biến và các tín hiệu theo ngữ cảnh được kích hoạt tại đây. Google Maps nhận ra vị trí của tôi và hiển thị năm vị trí phổ biến nhất được truy cập hoặc nhấp vào bởi những người trước đây đã nhập "ei". Tất cả các kết quả đều ở gần vị trí của tôi (xem Hình 1). Truy vấn “eif” đặt Tháp Eiffel ở vị trí thứ 3 vì điểm phổ biến cao hơn. (xem Hình 2)
Những gì chúng ta có?
Sử dụng công thức Haversine, tính toán khoảng cách giữa Vĩ độ/Kinh độ của người dùng và các vị trí khác trong thành phố hoặc mã zip. (xem Hình 3)
Ở cấp độ GMaps, nơi có hàng tỷ thực thể và hàng triệu người dùng, phương pháp này không thể mở rộng.
tái bút Một số bạn có thể hỏi liệu điều này có thể được thực hiện trong Tìm kiếm đàn hồi hay không. Kiểm tra Phân loại địa lý
Để làm cho tìm kiếm theo ngữ cảnh hoặc được cá nhân hóa hơn, bạn có thể cân nhắc sử dụng các phương pháp tiếp cận dựa trên dữ liệu có tính đến nhu cầu hoặc sở thích cụ thể của người dùng. Ví dụ: nếu Mr. Wolf đang tìm kiếm nhà hàng và đã thực hiện nhiều truy vấn liên quan đến nhà hàng trong một khoảng thời gian ngắn hoặc trong cùng một phiên, thì bạn có thể ưu tiên hiển thị cho anh ấy các kết quả được cá nhân hóa theo vị trí của anh ấy và cũng xem xét lịch sử tìm kiếm trước đây của anh ấy. Điều này có thể liên quan đến việc xếp hạng các nhà hàng gần anh ấy cao hơn trong kết quả tìm kiếm và giới thiệu cho anh ấy các lựa chọn phù hợp với sở thích hoặc sở thích của anh ấy hoặc những lần anh ấy ghé thăm các địa điểm khác nhau trước đây.
Bằng cách sử dụng các phương pháp tiếp cận dựa trên dữ liệu, bạn có thể cung cấp cho Mr. Wolf các kết quả tìm kiếm được nhắm mục tiêu và phù hợp hơn thay vì chỉ dựa vào các tiêu chí phổ biến hoặc dựa trên khoảng cách.
Không có mô hình Khoa học dữ liệu nào có thể đánh bại sự đơn giản của dữ liệu lịch sử được trình bày rõ ràng (xem Hình 6) với các thuật toán lưu vào bộ nhớ đệm: LFU (Ít được sử dụng thường xuyên nhất) hoặc LFU với Lão hóa động (kiểm tra liên kết bên dưới để biết giải thích chi tiết về LFU với Lão hóa động).
Kiểm tra Blog của tôi tại đây: https://shauryauppal.medium.com/thinking-data-strategies-in-fintech-universe-building-payments-recommendation-system-for-google-95c746e3dd0e
1. Chúng ta đã thảo luận tại sao 5 kết quả được hiển thị trong danh sách kết quả tìm kiếm
2. Xếp hạng kết quả dựa trên Mức độ phổ biến + Tính điểm khoảng cách
3. Sắp xếp địa lý trong tìm kiếm đàn hồi
4. Cá nhân hóa trong Tìm kiếm dựa trên danh mục truy vấn lịch sử
5. Làm thế nào để bạn xác định một thực thể là một vị trí phổ biến?
6. Các đề xuất dựa trên bộ nhớ đệm của các truy vấn tìm kiếm trước đây và các địa điểm đã ghé thăm
Cảm ơn mọi người đã trao cho tôi giải thưởng này
Kết nối, Theo dõi hoặc Xác nhận tôi trên LinkedIn nếu bạn thấy bài đọc này hữu ích. Để tìm hiểu thêm về tôi, hãy truy cập: Tại đây
Tôi đang tìm kiếm một vị trí Trưởng nhóm thú vị / Nhà khoa học dữ liệu cấp cao: Nếu bạn có điều gì đó cho tôi, hãy kết nối tại [email protected]