वेक्टर स्टोर msOpensearch1695Postgresql1807Neptune2236S3 वेक्टर स्टोर2284 Aurora क्षमता इकाई (ACU) $ 0.12 प्रति ACU प्रति घंटे वेक्टर स्टोर प्रकार रिट्रीव टाइमप्रकार मूल्य प्रति माहS3 वेक्टर2284 ms$3.54Neptune2236 ms$345PostgreSQL1807 ms$86OpenSearch1695 ms$172 15 जुलाई से, AWS ने Bedrock ज्ञानबेस के लिए S3 वेक्टर स्टोर का समर्थन जोड़ा है. वर्तमान में, यह कई स्टोर का समर्थन करता है: AWS managed: Others: OpenSearch MongoDB Atlas S3 vector store Pinecone PostgreSQL Redis Enterprise Cloud Neptune AWS managed: Others: OpenSearch MongoDB Atlas S3 vector store Pinecone PostgreSQL Redis Enterprise Cloud Neptune AWS प्रबंधित करता है: अन्य : हर एक क्या है? AWS प्रबंधित: खुले तौर पर: एक वितरित, सामुदायिक संचालित, Apache 2.0 लाइसेंस, 100% ओपन-सॉर्ड खोज और विश्लेषणात्मक श्रृंखला है जो वास्तविक समय में अनुप्रयोग निगरानी, लॉग विश्लेषण, और वेबसाइट खोज जैसे उपयोग के मामलों की एक विस्तृत श्रृंखला के लिए उपयोग की जाती है OpenSearch एक एकीकृत विज़ुअलाइज़ेशन टूल, OpenSearch डैशबोर्ड के साथ बड़ी मात्रा में डेटा के लिए त्वरित पहुंच और प्रतिक्रिया प्रदान करने के लिए एक अत्यधिक स्केलेबल प्रणाली प्रदान करता है, जो उपयोगकर्ताओं को अपने डेटा का पता लगाने के लिए आसान बनाता है OpenSearch Apache Lucene खोज पुस्तकालय द्वारा समर्थित है, और यह खोज और विश्लेषण क्षमताओं की एक संख्या का समर्थन करता है जैसे कि K-प्रत्यक्ष पड़ो खुलेआम खुलेआम S3 Vector स्टोर: Amazon S3 Vectors is the first cloud object store with native support to store and query vectors, delivering purpose-built, cost-optimized vector storage for AI agents, AI inference, and semantic search of your content stored in Amazon S3. By reducing the cost of uploading, storing, and querying vectors by up to 90%, S3 Vectors makes it cost-effective to create and use large vector datasets to improve the memory and context of AI agents as well as semantic search results of your S3 data. अमेज़ॅन एस 3 वेक्टर्स विक्टरों को संग्रहीत करने और पूछने के लिए मूल समर्थन के साथ पहला क्लाउड ऑब्जेक्ट स्टोर है, AI एजेंटों के लिए उद्देश्य-आधारित, लागत अनुकूलित वेक्टर स्टोरेज, AI निष्कर्षण, और अमेज़ॅन एस 3 में संग्रहीत आपके सामग्री के सेमेन्टिक खोज प्रदान करता है। AWS Aurora PostgreSQL के बारे में: Amazon Aurora PostgreSQL is a cloud-based, fully managed relational database service that is compatible with PostgreSQL. It combines the performance and availability of high-end commercial databases with the simplicity and cost-effectiveness of open-source databases, specifically PostgreSQL. Essentially, it's a PostgreSQL-compatible database offered as a service by Amazon Web Services Amazon Aurora PostgreSQL एक क्लाउड-आधारित, पूरी तरह से प्रबंधित रिलायंस डेटाबेस सेवा है जो PostgreSQL के साथ संगत है. यह उच्च स्तरीय वाणिज्यिक डेटाबेस की प्रदर्शन और उपलब्धता को खुले स्रोत डेटाबेस, विशेष रूप से PostgreSQL की सरलता और लागत प्रभावीता के साथ जोड़ता है. मूल रूप से, यह एक PostgreSQL संगत डेटाबेस है जो अमेज़ॅन वेब सेवाओं द्वारा एक सेवा के रूप में पेश किया जाता है अमेज़ॅन Neptune: Amazon Neptune is a fast, reliable, fully managed graph database service that makes it easy to build and run applications that work with highly connected datasets Amazon Neptune एक तेज़, विश्वसनीय, पूरी तरह से प्रबंधित ग्राफ़ डेटाबेस सेवा है जो बहुत कनेक्टेड डेटासेट्स के साथ काम करने वाली अनुप्रयोगों को बनाना और चलाना आसान बनाता है And non-AWS managed: MongoDB Atlas: MongoDB अटलास एक मल्टी-क्लाउड डेटाबेस सेवा है जो उसी लोगों द्वारा बनाई गई है जो MongoDB बनाते हैं. अटलास आपके डेटाबेस को तैनात करना और प्रबंधित करना सरल बनाता है, जबकि आपको अपने चुने हुए क्लाउड प्रदाता पर लचीले और प्रदर्शनशील वैश्विक एप्लिकेशन बनाने के लिए आवश्यक बहुमुखीता प्रदान करता है। Pinecone: Pinecone एक क्लाउड-आधारित वेक्टर डेटाबेस सेवा है जो एआई अनुप्रयोगों के लिए डिज़ाइन की गई है, विशेष रूप से उन लोगों के लिए जिनमें खोज बढ़ाया उत्पन्न होता है Redis Enterprise Cloud: रेडीस एंटरप्राइज़ क्लाउड एक पूर्ण प्रबंधित, अनुरोध पर, डेटाबेस-ए-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से-से- अब, हम समझते हैं कि प्रत्येक समर्थित स्टोर क्या है. मैं केवल एडब्ल्यूएस प्रबंधित स्टोर का परीक्षण करने और तुलना करने जा रहा हूं। मैं एक Python lambda फ़ंक्शन बनाया है। import json import time import boto3 def lambda_handler(event, context): """Demo: Bedrock Nova Micro with Knowledge Base timing comparison""" # Configuration - easily change these for testing MODEL_ID = "amazon.nova-micro-v1:0" # Allow override for comparison KNOWLEDGE_BASE_ID = event.get('kb_id') # Initialize clients bedrock_runtime = boto3.client('bedrock-runtime') bedrock_agent_runtime = boto3.client('bedrock-agent-runtime') query = event.get( 'query', 'Can you provide a list of bank holidays employers can have?') start_time = time.time() try: # 1. Retrieve from Knowledge Base kb_start = time.time() kb_response = bedrock_agent_runtime.retrieve( knowledgeBaseId=KNOWLEDGE_BASE_ID, retrievalQuery={'text': query}, retrievalConfiguration={ 'vectorSearchConfiguration': {'numberOfResults': 3}} ) kb_time = time.time() - kb_start # 2. Build context and prompt context = "\n".join([r['content']['text'] for r in kb_response.get('retrievalResults', [])]) prompt = f"Context: {context}\n\nQuestion: {query}\n\nAnswer:" # 3. Call Bedrock model model_start = time.time() response = bedrock_runtime.converse( modelId=MODEL_ID, messages=[{"role": "user", "content": [{"text": prompt}]}], inferenceConfig={"maxTokens": 500, "temperature": 0.7} ) model_time = time.time() - model_start total_time = time.time() - start_time answer = response['output']['message']['content'][0]['text'] return { 'statusCode': 200, 'body': json.dumps({ 'kb_id': KNOWLEDGE_BASE_ID, 'query': query, 'answer': answer, 'timing_ms': { 'kb_retrieval': round(kb_time * 1000), 'model_inference': round(model_time * 1000), 'total': round(total_time * 1000) }, 'chunks_found': len(kb_response.get('retrievalResults', [])) }) } except Exception as e: return { 'statusCode': 500, 'body': json.dumps({ 'error': str(e), 'kb_id': KNOWLEDGE_BASE_ID }) } इस उदाहरण में, हम प्रदर्शन की तुलना करने के लिए amazon.nova-micro-v1:0 बेडरॉक मॉडल का उपयोग करेंगे। यह lambda फ़ंक्शन प्रारूप में एक परीक्षण घटना की उम्मीद करता है: { "query": "Can you provide a list of bank holidays employers can have?", "kb_id": "AAUAL8BHQV" } प्रश्न - मेरे पाठ उदाहरण फ़ाइल से हमारी पूछताछ है. आप किसी भी पाठ फ़ाइल का उपयोग कर सकते हैं जो आप चाहते हैं। kb_id - ज्ञान आधार आईडी; हम परीक्षण के लिए एक बेडरॉक ज्ञान आधार बनाएंगे और मैंने विभिन्न डेटा स्रोतों का उपयोग करके 4 अलग-अलग ज्ञान आधार बनाए हैं: और अंत में, हमारे पास हमारे परीक्षण करने के लिए आवश्यक सब कुछ है: चलो लैम्डा फ़ंक्शन चलाते हैं और इसे सही तरीके से परीक्षण करने के लिए केवल ज्ञानबेस आईडी को बदलते हैं। OpenSearch: Neptune: PostgreSQL: S3 Vector store: और बेहतर दृश्य के लिए, निष्पादन समय के अनुसार क्रमबद्ध: वेक्टर स्टोर msOpensearch1695Postgresql1807Neptune2236S3 वेक्टर स्टोर2284 वेक्टर की दुकान MS में कार्य समय जैसा कि आप यहां देख सकते हैं, OpenSearch एक तेजी से भंडारण समाधान है. लेकिन लागत के बारे में क्या? OCU के रूप में भुगतान करें OpenSearch OpenSearch Compute Unit (OCU) - Indexing $0.24 per OCU per hour OpenSearch Compute Unit (OCU) - Search and Query $0.24 per OCU per hour OpenSearch Compute Unit (OCU) - Indexing $0.24 per OCU per hour OpenSearch Compute Unit (OCU) - Search and Query $0.24 per OCU per hour न्यूनतम OCU आप भुगतान कर सकते हैं 0.5. इसका मतलब है $0.24 * 24 घंटे * 30 दिन * 2 (इंडेक्सिंग, खोज और पूछताछ) * 0.5 (कम से कम OCU) = $172. : PostgreSQL - pay per ACU Aurora क्षमता इकाई (ACU) $ 0.12 प्रति ACU प्रति घंटे न्यूनतम एसीयू आप भुगतान कर सकते हैं 0. लेकिन 1 एसीयू आपको $ 0.12 खर्च करेगा * 24 घंटे * 30 दिन = $ 86 : Neptune Memory-optimized Neptune Capacity Units configuration Cost 16 m-NCUs $0.48 per hour 32 m-NCUs $0.96 per hour 64 m-NCUs $1.92 per hour 128 m-NCUs $3.84 per hour 256 m-NCUs $7.68 per hour 384 m-NCUs $11.52 per hour Memory-optimized Neptune Capacity Units configuration Cost 16 m-NCUs $0.48 per hour 32 m-NCUs $0.96 per hour 64 m-NCUs $1.92 per hour 128 m-NCUs $3.84 per hour 256 m-NCUs $7.68 per hour 384 m-NCUs $11.52 per hour न्यूनतम उदाहरण प्रति घंटे $ 0.48 है. इसका मतलब है कि प्रति माह यह आपको $ 0.48 * 24 घंटे * 30 दिन = $ 345. वाह! S3 vector store, here - you will need to pay for requests and storage. S3 वेक्टर स्टोरेज /महा - वेक्टर डेटा, कुंजी, और मेटाडेटा का मासिक तार्किक स्टोरेज = $0.06 per GB S3 Vectors request pricing PUT अनुरोध (जीबी प्रति)* GET, LIST और सभी अन्य अनुरोध (1000 अनुरोधों प्रति) S3 वेक्टर प्रति जीबी $0.20 की मांग करता है $0.055 *PUT प्रति PUT 128KB की न्यूनतम शुल्क के अधीन है. PUT लागत को कम करने के लिए, आप प्रत्येक PUT अनुरोध पर कई वेक्टर बैच कर सकते हैं। S3 Vector Query मूल्य निर्धारण S3 वेक्टर पूछताछ अनुरोध (प्रति 1,000 अनुरोध) $0.0025 S3 वेक्टर डेटा - औसत वेक्टर आकार (वेक्टर डेटा, कुंजी, और फ़िल्टर योग्य मेटाडेटा) से गुणा किए गए प्रति सूचकांक के लिए वेक्टरों की समानता पहले 100 हजार वेक्टर $ 0.0040 प्रति TB 100 हजार से अधिक वेक्टर $ 0.0020 प्रति TB TLDR के लिए: S3 Vectors storage charge ((4 बैट्स * 1024 आयाम) वेक्टर डेटा / वेक्टर + 1 KB फ़िल्टर योग्य मेटाडेटा / वेक्टर + 1 KB गैर फ़िल्टर योग्य मेटाडेटा / वेक्टर + 0.17 KB कुंजी / वेक्टर) = औसत वेक्टर प्रति 6.17 KB तार्किक भंडारण। 6.17 KB / औसत वेक्टर * 250,000 वेक्टर * 40 वेक्टर इंडेक्स = 59 GB तार्किक स्टोरेज। कुल मासिक भंडारण लागत = 59 जीबी * $0.06/जीबी प्रति माह = $3.54 Final comparison table: वेक्टर स्टोर प्रकार रिट्रीव टाइमप्रकार मूल्य प्रति माहS3 वेक्टर2284 ms$3.54Neptune2236 ms$345PostgreSQL1807 ms$86OpenSearch1695 ms$172 Vector स्टोर प्रकार वापसी का समय प्रति माह के बारे में कीमत यदि गति इतनी महत्वपूर्ण नहीं है, तो मैं एस 3 वेक्टर स्टोर चुनूंगा. स्पष्ट विजेता, अन्यथा, ओपनसेच है, जो शायद एक बेहतर विकल्प होगा। आप अपने परियोजना में किस वेक्टर स्टोर का उपयोग कर रहे हैं?