Vector storeThời gian thực hiện trong msOpensearch1695Postgresql1807Neptune2236S3 vector store2284 Aurora Capacity Unit (ACU) $0.12 mỗi ACU mỗi giờ Loại cửa hàng vector Thời gian truy cậpGần giá mỗi thángS3 Vector2284 ms$3.54Neptune2236 ms$345PostgreSQL1807 ms$86OpenSearch1695 ms$172 Bắt đầu từ ngày 15 tháng 7, AWS đã thêm hỗ trợ cho các cửa hàng vector S3 cho cơ sở kiến thức Bedrock. AWS managed: Others: OpenSearch MongoDB Atlas S3 vector store Pinecone PostgreSQL Redis Enterprise Cloud Neptune AWS managed: Others: OpenSearch MongoDB Atlas S3 vector store Pinecone PostgreSQL Redis Enterprise Cloud Neptune AWS quản lý: Những người khác: Mỗi người là gì? AWS quản lý: Tìm kiếm mở: OpenSearch là một bộ phân phối, dựa trên cộng đồng, được cấp phép bởi Apache 2.0, phần mềm tìm kiếm và phân tích nguồn mở 100% được sử dụng cho một loạt các trường hợp sử dụng như theo dõi ứng dụng thời gian thực, phân tích nhật ký và tìm kiếm trang web. OpenSearch cung cấp một hệ thống có khả năng mở rộng cao để cung cấp truy cập nhanh và phản ứng với khối lượng lớn dữ liệu với một công cụ trực quan hóa tích hợp, OpenSearch Dashboards, giúp người dùng dễ dàng khám phá dữ liệu của họ. OpenSearch được cung cấp bởi thư viện tìm kiếm Apache Lucene, và nó hỗ trợ một số khả năng tìm kiếm và phân tích như tìm kiếm K-nearest neighbors (KNN), SQL, Anomaly Detection, Machine Learning Commons, Trace Analytics, tìm kiếm toàn văn bản, và nhiều hơn nữa. OpenSearch OpenSearch S3 Vector cửa hàng: Amazon S3 Vectors is the first cloud object store with native support to store and query vectors, delivering purpose-built, cost-optimized vector storage for AI agents, AI inference, and semantic search of your content stored in Amazon S3. By reducing the cost of uploading, storing, and querying vectors by up to 90%, S3 Vectors makes it cost-effective to create and use large vector datasets to improve the memory and context of AI agents as well as semantic search results of your S3 data. Amazon S3 Vectors là cửa hàng đối tượng đám mây đầu tiên với hỗ trợ bản địa để lưu trữ và truy vấn vector, cung cấp lưu trữ vector được xây dựng cho mục đích, tối ưu hóa chi phí cho các đại lý AI, kết luận AI và tìm kiếm ngữ nghĩa của nội dung của bạn được lưu trữ trong Amazon S3. Bằng cách giảm chi phí tải lên, lưu trữ và truy vấn vector lên đến 90%, S3 Vectors làm cho nó hiệu quả về chi phí để tạo và sử dụng các tập dữ liệu vector lớn để cải thiện bộ nhớ và bối cảnh của các đại lý AI cũng như kết quả tìm kiếm ngữ nghĩa của dữ liệu S3. Cấu hình AWS Aurora PostgreSQL: Amazon Aurora PostgreSQL is a cloud-based, fully managed relational database service that is compatible with PostgreSQL. It combines the performance and availability of high-end commercial databases with the simplicity and cost-effectiveness of open-source databases, specifically PostgreSQL. Essentially, it's a PostgreSQL-compatible database offered as a service by Amazon Web Services Amazon Aurora PostgreSQL là một dịch vụ cơ sở dữ liệu quan hệ dựa trên đám mây, được quản lý đầy đủ tương thích với PostgreSQL. Nó kết hợp hiệu suất và khả năng sẵn có của các cơ sở dữ liệu thương mại cao cấp với sự đơn giản và hiệu quả về chi phí của các cơ sở dữ liệu nguồn mở, đặc biệt là PostgreSQL. Về cơ bản, nó là một cơ sở dữ liệu tương thích với PostgreSQL được cung cấp như một dịch vụ bởi Amazon Web Services Amazon Neptune: Amazon Neptune is a fast, reliable, fully managed graph database service that makes it easy to build and run applications that work with highly connected datasets Amazon Neptune là một dịch vụ cơ sở dữ liệu đồ thị nhanh, đáng tin cậy, được quản lý đầy đủ giúp dễ dàng xây dựng và chạy các ứng dụng hoạt động với các bộ dữ liệu được kết nối cao. And non-AWS managed: MongoDB Atlas: MongoDB Atlas là một dịch vụ cơ sở dữ liệu đa đám mây bởi cùng những người xây dựng MongoDB. Atlas đơn giản hóa việc triển khai và quản lý cơ sở dữ liệu của bạn trong khi cung cấp tính linh hoạt bạn cần để xây dựng các ứng dụng toàn cầu có khả năng phục hồi và hiệu suất trên các nhà cung cấp đám mây của sự lựa chọn của bạn. Pinecone: Pinecone là một dịch vụ cơ sở dữ liệu vector dựa trên đám mây được thiết kế cho các ứng dụng AI, đặc biệt là những ứng dụng liên quan đến sản xuất tăng cường truy xuất. Redis Enterprise Cloud: Redis Enterprise Cloud là một dịch vụ được quản lý đầy đủ, theo yêu cầu, cơ sở dữ liệu như một dịch vụ (DBaaS) từ Redis, được xây dựng trên nền tảng của Redis nguồn mở Bây giờ, chúng tôi hiểu mỗi cửa hàng được hỗ trợ là gì.Tôi sẽ thử nghiệm và so sánh chỉ các cửa hàng được quản lý bởi AWS. Tôi đã tạo ra một hàm Python lambda. import json import time import boto3 def lambda_handler(event, context): """Demo: Bedrock Nova Micro with Knowledge Base timing comparison""" # Configuration - easily change these for testing MODEL_ID = "amazon.nova-micro-v1:0" # Allow override for comparison KNOWLEDGE_BASE_ID = event.get('kb_id') # Initialize clients bedrock_runtime = boto3.client('bedrock-runtime') bedrock_agent_runtime = boto3.client('bedrock-agent-runtime') query = event.get( 'query', 'Can you provide a list of bank holidays employers can have?') start_time = time.time() try: # 1. Retrieve from Knowledge Base kb_start = time.time() kb_response = bedrock_agent_runtime.retrieve( knowledgeBaseId=KNOWLEDGE_BASE_ID, retrievalQuery={'text': query}, retrievalConfiguration={ 'vectorSearchConfiguration': {'numberOfResults': 3}} ) kb_time = time.time() - kb_start # 2. Build context and prompt context = "\n".join([r['content']['text'] for r in kb_response.get('retrievalResults', [])]) prompt = f"Context: {context}\n\nQuestion: {query}\n\nAnswer:" # 3. Call Bedrock model model_start = time.time() response = bedrock_runtime.converse( modelId=MODEL_ID, messages=[{"role": "user", "content": [{"text": prompt}]}], inferenceConfig={"maxTokens": 500, "temperature": 0.7} ) model_time = time.time() - model_start total_time = time.time() - start_time answer = response['output']['message']['content'][0]['text'] return { 'statusCode': 200, 'body': json.dumps({ 'kb_id': KNOWLEDGE_BASE_ID, 'query': query, 'answer': answer, 'timing_ms': { 'kb_retrieval': round(kb_time * 1000), 'model_inference': round(model_time * 1000), 'total': round(total_time * 1000) }, 'chunks_found': len(kb_response.get('retrievalResults', [])) }) } except Exception as e: return { 'statusCode': 500, 'body': json.dumps({ 'error': str(e), 'kb_id': KNOWLEDGE_BASE_ID }) } Trong ví dụ này, chúng ta sẽ sử dụng mô hình nền Amazon.nova-micro-v1:0 để so sánh hiệu suất. Chức năng lambda này mong đợi một sự kiện thử nghiệm ở định dạng: { "query": "Can you provide a list of bank holidays employers can have?", "kb_id": "AAUAL8BHQV" } truy vấn - là truy vấn của chúng tôi từ tập tin ví dụ văn bản của tôi. Bạn có thể sử dụng bất kỳ tập tin văn bản nào bạn muốn. kb_id - Knowledge Base ID; chúng tôi sẽ tạo ra một cơ sở kiến thức nền tảng để kiểm tra Và tôi đã tạo ra 4 cơ sở kiến thức khác nhau sử dụng các nguồn dữ liệu khác nhau: Và cuối cùng, chúng tôi có mọi thứ chúng tôi cần để thực hiện các bài kiểm tra của chúng tôi: Hãy chạy hàm lambda và chỉ thay đổi ID cơ sở kiến thức để kiểm tra nó đúng cách. OpenSearch: Neptune: PostgreSQL: S3 Vector store: Và cho một hình ảnh tốt hơn, được sắp xếp theo thời gian thực hiện: Vector storeThời gian thực hiện trong msOpensearch1695Postgresql1807Neptune2236S3 vector store2284 Cửa hàng Vector Thời gian thực hiện trong ms Như bạn có thể thấy ở đây, OpenSearch là một giải pháp lưu trữ nhanh hơn. - Thanh toán theo OCU. OpenSearch OpenSearch Compute Unit (OCU) - Indexing $0.24 per OCU per hour OpenSearch Compute Unit (OCU) - Search and Query $0.24 per OCU per hour OpenSearch Compute Unit (OCU) - Indexing $0.24 per OCU per hour OpenSearch Compute Unit (OCU) - Search and Query $0.24 per OCU per hour OCU tối thiểu bạn có thể trả là 0.5. Nó có nghĩa là $0.24 * 24 giờ * 30 ngày * 2 (đăng ký, tìm kiếm và truy vấn) * 0.5 (tối thiểu OCU) = $172. : PostgreSQL - pay per ACU Aurora Capacity Unit (ACU) $0.12 mỗi ACU mỗi giờ ACU tối thiểu bạn có thể trả là 0. nhưng 1 ACU sẽ tốn bạn $0.12 * 24 giờ * 30 ngày = $86 : Neptune Memory-optimized Neptune Capacity Units configuration Cost 16 m-NCUs $0.48 per hour 32 m-NCUs $0.96 per hour 64 m-NCUs $1.92 per hour 128 m-NCUs $3.84 per hour 256 m-NCUs $7.68 per hour 384 m-NCUs $11.52 per hour Memory-optimized Neptune Capacity Units configuration Cost 16 m-NCUs $0.48 per hour 32 m-NCUs $0.96 per hour 64 m-NCUs $1.92 per hour 128 m-NCUs $3.84 per hour 256 m-NCUs $7.68 per hour 384 m-NCUs $11.52 per hour Ví dụ tối thiểu là $ 0.48 mỗi giờ. Nó có nghĩa là mỗi tháng nó sẽ chi phí cho bạn $ 0.48 * 24 giờ * 30 ngày = $ 345. Wow! S3 vector store, here - you will need to pay for requests and storage. S3 Vector Storage / Month - lưu trữ logic hàng tháng của dữ liệu vector, key, và metadata = $0.06 per GB S3 Vectors request pricing Yêu cầu PUT (mỗi GB)* GET, LIST và tất cả các yêu cầu khác (mỗi 1.000 yêu cầu) S3 Vectors Yêu cầu $0.20 mỗi GB $0.055 *PUT chịu mức phí tối thiểu là 128KB cho mỗi PUT. Để giảm chi phí PUT, bạn có thể lô nhiều vector cho mỗi yêu cầu PUT. S3 Vector query giá S3 Yêu cầu truy vấn vector (mỗi 1.000 yêu cầu) $0.0025 S3 Dữ liệu vector - tổng các vector trên mỗi chỉ mục nhân với kích thước vector trung bình (dữ liệu vector, khóa và siêu dữ liệu có thể lọc) 100 nghìn vector đầu tiên $0.0040 mỗi TB Hơn 100 nghìn vector $0.0020 mỗi TB TLDR của: S3 Vectors storage charge ((4 byte * 1024 chiều) dữ liệu vector / vector + 1 KB siêu dữ liệu / vector có thể lọc + 1 KB siêu dữ liệu / vector không thể lọc + 0.17 KB phím / vector) = 6.17 KB lưu trữ logic cho mỗi vector trung bình. 6.17 KB / trung bình vector * 250.000 vector * 40 vector index = 59 GB lưu trữ logic. Tổng chi phí lưu trữ hàng tháng = 59 GB * $0.06/GB mỗi tháng = $3.54 Final comparison table: Loại cửa hàng vector Thời gian truy cậpGần giá mỗi thángS3 Vector2284 ms$3.54Neptune2236 ms$345PostgreSQL1807 ms$86OpenSearch1695 ms$172 Loại vector Thời gian retrieval Khoảng giá mỗi tháng Nếu tốc độ không quá quan trọng, tôi sẽ chọn cửa hàng vector S3. người chiến thắng rõ ràng, nếu không, là OpenSearch, có lẽ sẽ là một lựa chọn tốt hơn. Bạn đang sử dụng cửa hàng vector nào trong dự án của mình?