การทำให้ AI เป็นประชาธิปไตย: CTO ของ IO.NET สร้าง 'Airbnb ของ GPU' ได้อย่างไร

การเติบโตของปัญญาประดิษฐ์ได้สร้างความต้องการพลังการประมวลผลของ GPU ที่ไม่เคยมีมาก่อน แต่การเข้าถึงยังคงกระจุกตัวอยู่ในผู้ให้บริการคลาวด์รายใหญ่เพียงไม่กี่ราย IO.NET ซึ่งเป็นบริษัทสตาร์ทอัพที่เน้นโครงสร้างพื้นฐาน GPU แบบกระจายอำนาจ มีเป้าหมายที่จะเปลี่ยนแปลงพลวัตนี้โดยสร้างสิ่งที่ผู้นำเรียกว่า "Airbnb ของ GPU" ในการสัมภาษณ์พิเศษครั้งนี้ Gaurav ซึ่งเป็น CTO ของ IO.NET และอดีตผู้นำทางเทคนิคของ Binance กล่าวถึงวิธีการที่บริษัทกำลังสร้างแพลตฟอร์มที่สามารถทำให้การเข้าถึงทรัพยากรการประมวลผลของ AI เป็นประชาธิปไตยในขณะที่ลดต้นทุนได้มากถึง 75% เมื่อเทียบกับผู้ให้บริการแบบดั้งเดิม : ยินดีต้อนรับสู่ซีรีส์ 'Behind the Startup' ของเรา โปรดเล่าให้เราฟังเกี่ยวกับตัวคุณ เส้นทางของคุณ และแรงบันดาลใจที่ทำให้คุณตัดสินใจเข้าร่วม อิชาน IO.NET : การเดินทางของผมค่อนข้างตรงไปตรงมา โดยเริ่มต้นเป็นวิศวกรซอฟต์แวร์ในเมืองปูเน่ ผมเคยทำงานที่บริษัทสตาร์ทอัพหลายแห่งที่นั่น ก่อนจะย้ายไปบังกาลอร์ ซึ่งผมได้เข้าร่วมกับฝ่ายวิจัยและพัฒนาของ HP และช่วยสร้างระบบไฟล์เครือข่ายตั้งแต่ต้น ที่ Amazon ผมทำงานเกี่ยวกับกระบวนการเผยแพร่สำหรับแอพ Android หนังสืออิเล็กทรอนิกส์ และหนังสือ Audible จากนั้นผมจึงย้ายไปที่ eBay จากนั้นจึงตามด้วยบริษัท OTA รายใหญ่ในประเทศไทย ซึ่งเป็นผู้นำตลาดในเวียดนาม สิงคโปร์ และมาเลเซีย สำหรับการจองโรงแรมและเที่ยวบิน Gaurav ฉันใช้เวลาราว 5-6 ปีในทีมผู้นำก่อนที่จะเข้าร่วม Binance ซึ่งฉันเป็นผู้นำในการสร้างแพลตฟอร์มที่ปรับขนาดได้สำหรับการปฏิบัติตาม KYC และการตรวจจับการฉ้อโกงสำหรับผู้ใช้มากกว่า 500 ล้านคน ตลอดอาชีพการงานของฉัน ฉันทำงานกับ AI ในรูปแบบต่างๆ และได้เห็นด้วยตาตนเองว่าผู้คนประสบปัญหาในการเข้าถึงทรัพยากรคอมพิวเตอร์ที่พวกเขาต้องการอย่างไร : บอกเราหน่อยเกี่ยวกับบทบาทของคุณที่ และอนาคตที่คุณมองเห็นสำหรับการประมวลผลแบบกระจายอำนาจเมื่อเทียบกับสถาปัตยกรรมแบบรวมศูนย์จะเป็นอย่างไร? อิชาน IO.NET : ในฐานะ CTO บทบาทหลักของฉันคือการสร้างแพลตฟอร์มที่ปรับขนาดได้ ซึ่งช่วยให้ซัพพลายเออร์เชื่อมต่อได้ง่าย และช่วยให้ผู้บริโภคใช้ทรัพยากรเหล่านี้ได้ เราเริ่มต้นด้วย GPU แต่วิสัยทัศน์ของเรามีมากกว่านั้น Gaurav ข้อได้เปรียบหลักของแนวทางการกระจายอำนาจของเราคือความสามารถในการปรับขนาด ศูนย์ข้อมูลแบบดั้งเดิมต้องเผชิญกับความท้าทายที่สำคัญเมื่อขยายไปยังภูมิภาคใหม่ ซึ่งได้แก่ การเช่าพื้นที่ จ้างทีมงาน สั่งซื้ออุปกรณ์ และดูแลการบำรุงรักษา ซึ่งทำให้มีค่าใช้จ่ายล่วงหน้าจำนวนมากซึ่งท้ายที่สุดแล้วจะถูกส่งต่อไปยังผู้ใช้ โมเดลการกระจายอำนาจของเราช่วยให้เราปรับขนาดได้อย่างมีประสิทธิภาพมากขึ้นโดยใช้ประโยชน์จากโครงสร้างพื้นฐานที่มีอยู่ : รูปแบบธุรกิจของคุณทำงานอย่างไรเมื่อเทียบกับผู้จำหน่ายแบบรวมศูนย์เช่น Azure ซึ่งเรียกเก็บเงินจำนวนมากสำหรับการโฮสต์โมเดล AI อิชาน : เราใช้โมเดลที่คล้ายกับ Uber ซึ่งใครๆ ก็สามารถสร้างซอฟต์แวร์ที่คล้ายคลึงกันได้ แต่ข้อได้เปรียบของเราอยู่ที่การเชื่อมโยงด้านอุปทาน ทีมงานของเราได้สร้างความสัมพันธ์อันแน่นแฟ้นกับผู้ให้บริการโครงสร้างพื้นฐานทั่วโลก ทำให้เราสามารถจัดหา GPU ในราคาที่สามารถแข่งขันได้ โดยทั่วไปแล้ว ราคาของเราถูกกว่า Amazon และ Google ถึง 75% Gaurav เรามีทั้งอัตราค่าจ้างรายชั่วโมงและสัญญาระยะยาว 6-9 เดือน นอกจากนี้ เรายังมีบริการจัดการสำหรับธุรกิจสตาร์ทอัพที่ต้องการมุ่งเน้นไปที่ธุรกิจหลักมากกว่าการจัดการโครงสร้างพื้นฐาน : แล้วแรงฉุดลากเป็นยังไงบ้าง? อิชาน : ผลตอบรับดีมาก เราเพิ่งจะทำตามคำสั่งซื้อ 4090 จำนวน 1,500 เครื่อง และใกล้จะลงนามข้อตกลงกับบริษัท Web2 ในเอเชียสองแห่ง ซึ่งแต่ละแห่งมีผู้ใช้งานมากกว่า 200 ล้านคน แม้ว่าในตอนแรกเราจะมุ่งเน้นไปที่บริษัทด้านคริปโตเนื่องจากเครือข่ายของเรา แต่เราก็เห็นความสนใจที่เพิ่มมากขึ้นจากบริษัทเทคโนโลยีดั้งเดิมที่ต้องการประหยัดต้นทุน Gaurav : คุณอธิบายได้ไหมว่าสถาปัตยกรรมการฝึกอบรมแบบกระจายอำนาจจะทำงานอย่างไร การกระจายอำนาจอาจส่งผลกระทบต่อความสามารถในการปรับขนาดหรือความปลอดภัย เราจะปรับความเข้าใจเรื่องนี้ได้อย่างไร อิชาน : ขึ้นอยู่กับว่าคุณกำหนดความสามารถในการปรับขนาดอย่างไร ขอให้ผมอธิบายด้วยตัวอย่างจากธุรกิจศูนย์ข้อมูล หากคุณเป็นผู้ให้บริการศูนย์ข้อมูลในอเมริกาเหนือและผมต้องการ H100 จำนวน 1,000 เครื่องในสิงคโปร์ กระบวนการแบบเดิมนั้นท้าทายมาก คุณจะต้องเช่าพื้นที่ จ้างทีม สั่งซื้อ GPU จัดการการขนส่ง การบำรุงรักษา และการตั้งค่า ซึ่งจะทำให้มีค่าใช้จ่ายเบื้องต้นจำนวนมากและใช้เวลาในการนำสินค้าออกสู่ตลาดนานขึ้น ซึ่งท้ายที่สุดแล้วจะถูกส่งต่อไปยังผู้ใช้ Gaurav ในโมเดลแบบกระจายศูนย์ของเรา เนื่องจากสินค้าคงคลังกระจายตัวออกไป เราจึงไม่ต้องเผชิญความท้าทายเหล่านี้ การเพิ่มขีดความสามารถนั้นง่ายพอๆ กับการเชื่อมต่อผู้ให้บริการรายใหม่เข้ากับแพลตฟอร์มของเรา ซึ่งก็คล้ายกับการทำงานของความพร้อมของโรงแรม เพียงเพราะเครือโรงแรมใหญ่ๆ เต็มแล้วไม่ได้หมายความว่าจะไม่มีห้องว่างในเมือง จริงๆ แล้วมีขีดความสามารถของ GPU จำนวนมาก แต่ไม่มีใครสร้าง "Airbnb สำหรับ GPU" เพื่อรวบรวมสินค้าคงคลังเหล่านี้อย่างมีประสิทธิภาพ : เพื่อให้เข้าใจถูกต้อง - หากมีนักเรียนหรือเกมเมอร์ในบังกาลอร์และมีบริษัทในสหรัฐอเมริกาที่มี GPU ที่ไม่ได้ใช้งาน พวกเขาสามารถเชื่อมต่อผ่านแพลตฟอร์มของคุณได้หรือไม่? อิชาน : ใช่แล้ว ใครก็ตามจากประเทศไทยหรืออินเดียที่ต้องการฝึกโมเดลเฉพาะ ไม่ว่าจะเป็น LSTM หรือประเภทอื่นใด ก็สามารถใช้ GPU เหล่านี้ได้ เนื่องจากเป็นโมเดลแบบเช่า จึงประหยัดกว่าผู้ให้บริการแบบดั้งเดิม Gaurav : คุณคิดอย่างไรเกี่ยวกับการแข่งขันระหว่างโมเดลชายแดนในตอนนี้ ตั้งแต่ลามาจนถึง OpenAI และไปจนถึงแอนโทรปิก? อิชาน : ในตอนนี้ยังเป็นเพียงการคาดเดาเท่านั้น เราได้ก้าวกระโดดอย่างมากในด้านความสามารถของ AI ในช่วงสองสามปีที่ผ่านมา แม้ว่าจะยังไม่ชัดเจนว่าบริษัทใดจะเป็นผู้นำในด้านนี้ในที่สุด ซึ่งอาจเป็นผู้เล่น Web3 ก็ได้ แต่สิ่งที่แน่นอนคือเราจะได้เห็นนวัตกรรมใหม่ๆ มากมายในอีกสามปีข้างหน้า Gaurav : ตอนนี้โครงสร้างโมเดลการกำกับดูแลของ เป็นอย่างไรบ้าง? อิชาน IO.NET : ปัจจุบันเราอยู่ในรูปแบบกึ่งกระจายอำนาจ เรารับฟังชุมชนของเราอย่างกระตือรือร้นผ่าน AMA รายสัปดาห์และนำข้อเสนอแนะของพวกเขาไปใช้ ทีมงานภายในของเราตรวจสอบตั๋วและคำขอของผู้ใช้ทุกรายเป็นรายสัปดาห์เพื่อกำหนดลำดับความสำคัญในการพัฒนาของเรา การมีส่วนร่วมของชุมชนของเราเกิดขึ้นเป็นหลักผ่าน X (เดิมคือ Twitter), Discord และ AMA ของเรา โดยมีผู้ติดตามมากกว่าครึ่งล้านคนบนแพลตฟอร์มต่างๆ Gaurav : คุณเผชิญกับความท้าทายทางเทคนิคอะไรบ้างในขณะที่พัฒนาแพลตฟอร์มนี้ เนื่องจากเป็นแนวคิดใหม่ที่ไม่มีสถาปัตยกรรม AI แบบกระจายอำนาจที่มีอยู่? อิชาน : การขยายตัวอย่างรวดเร็วของเรานำมาซึ่งทั้งโอกาสและความท้าทาย เมื่อฉันเข้าร่วม แพลตฟอร์มได้รับการออกแบบมาเพื่อรองรับ GPU 100,000 ตัว แต่เราจำเป็นต้องรองรับหลายล้านตัวอย่างรวดเร็ว ซึ่งจำเป็นต้องมีการเปลี่ยนแปลงสถาปัตยกรรมที่สำคัญเพื่อจัดการความปลอดภัย ความเสถียร และความสามารถในการปรับขนาด ผู้ก่อตั้งตระหนักถึงความจำเป็นของผู้นำที่มีประสบการณ์ในการสร้างแพลตฟอร์มที่ปรับขนาดได้ ซึ่งนำไปสู่การจ้างฉันและทำให้ฉันสามารถสร้างทีมงานมืออาชีพที่มีประสบการณ์จากบริษัทต่างๆ เช่น Amazon, VMware และนักวิจัย AI ชั้นนำ Gaurav สิ่งสำคัญคือการมีบุคลากรที่เคยสร้างระบบที่ปรับขนาดได้แบบเดียวกันมาก่อน เราได้รวบรวมทีมงานที่ประกอบด้วยผู้สำเร็จการศึกษาระดับปริญญาเอกด้านการเรียนรู้ของเครื่องจักรและผู้มีประสบการณ์จากบริษัทเทคโนโลยีชั้นนำ โดยทุกคนมุ่งเน้นที่การแก้ไขปัญหาทางเทคนิคที่ซับซ้อนเหล่านี้ในขณะที่ยังคงรักษาลักษณะการกระจายอำนาจของแพลตฟอร์มไว้ : เล่าให้เราฟังเพิ่มเติมเกี่ยวกับประวัติของทีม การเดินทางเริ่มต้นอย่างไร ไอเดียแรกคืออะไร จุดเปลี่ยนใดๆ ก่อนที่จะมาถึงโมเดลนี้ และคุณมองเห็นอนาคตของ อย่างไรในอีก 1-2 ปีข้างหน้า อิชาน IO.NET : ฉันเข้าร่วมเมื่อประมาณเจ็ดเดือนที่แล้ว ประมาณสามถึงสี่เดือนหลังจากก่อตั้งบริษัท ตั้งแต่วันแรก วิสัยทัศน์คือการสร้างแพลตฟอร์ม DeFi และ AI แบบผสมผสานเพื่อให้ผู้สร้างสามารถสร้างโมเดลได้ เมื่อฉันเข้าร่วม ผู้ก่อตั้งและฉันก็เห็นพ้องต้องกันในกลยุทธ์ที่สำคัญ นั่นคือ เราต้องเสนอสิ่งที่คู่แข่งไม่สามารถเทียบเคียงได้ เราพบว่าการจัดหา GPU ในราคาที่แข่งขันได้คือสิ่งที่ทำให้แตกต่าง Gaurav แม้ว่าแพลตฟอร์มคริปโตอื่นๆ อาจเสนอราคาที่ใกล้เคียงกัน แต่แพลตฟอร์มเหล่านี้ก็ประสบปัญหาในการขยายขนาด หากคุณขอ GPU 1,500 ตัวจากพวกเขา พวกเขามักจะทำไม่ได้เพราะรูปแบบธุรกิจของพวกเขาไม่ได้กระจายอำนาจอย่างแท้จริง แม้ว่าพวกเขาจะสร้างสัญญาอัจฉริยะ แต่ถ้าพวกเขาเป็นเจ้าของศูนย์ข้อมูลของตัวเอง การขยายขนาดก็กลายเป็นเรื่องท้าทายอย่างยิ่ง นี่เป็นปัญหาเดียวกับที่ Azure เผชิญ นั่นคือ คุณไม่สามารถอ้างได้ว่าเป็นการกระจายอำนาจเพียงแค่เพิ่มสัญญาอัจฉริยะไว้บนโครงสร้างพื้นฐานแบบรวมศูนย์ : การพัฒนาซอฟต์แวร์นั้นเป็นเรื่องท้าทายอยู่เสมอ เมื่อพัฒนาแพลตฟอร์มนี้ ซึ่งถือเป็นเรื่องใหม่เนื่องจากยังไม่มีสถาปัตยกรรม AI แบบกระจายอำนาจสำหรับการโฮสต์ GPU ในขณะนี้ คุณพบปัญหาทางเทคนิคใดบ้าง อิชาน : เราเผชิญกับความท้าทายที่น่าสนใจในการขยายขนาดได้เร็วกว่าที่คาดไว้มาก ซึ่งเป็นปัญหาที่ดีในมุมมองทางธุรกิจ แต่ยุ่งยากในมุมมองทางวิศวกรรม ลองนึกภาพว่าต้องสร้างแพลตฟอร์มสำหรับ GPU 100,000 ตัว แล้วจู่ๆ ก็ต้องรองรับครึ่งล้านตัวหรือมากกว่านั้น ระหว่างการส่งแบบแอร์ดรอป เราเผชิญกับผู้ใช้จำนวนมหาศาลที่หลั่งไหลเข้ามาและการโจมตีแบบ Sybil ที่อาจเกิดขึ้นได้ในขณะที่ขยายขนาดอย่างรวดเร็ว Gaurav การสร้างแพลตฟอร์มที่ปลอดภัยและมีเสถียรภาพซึ่งสามารถรองรับคลัสเตอร์ 50-100 คลัสเตอร์พร้อมกันได้โดยไม่มีคอขวด ในขณะที่ยังเพิ่ม GPU ได้อย่างรวดเร็ว 1,000 ตัวต่อนาที ถือเป็นความท้าทายที่สำคัญ ผู้ก่อตั้งตระหนักดีว่าแม้ว่าเขาสามารถสร้างบริษัทให้ไปถึงระดับหนึ่งได้ แต่การจะก้าวไปไกลกว่านี้ต้องอาศัยบุคลากรที่มีประสบการณ์ในการสร้างแพลตฟอร์มและธุรกิจที่ปรับขนาดได้ นั่นคือสิ่งที่ฉันเคารพเกี่ยวกับเขา เขาตระหนักถึงความต้องการนี้และมอบอำนาจให้ฉันสร้างทีมที่เหมาะสม เราได้นำบุคลากรจาก Amazon, VMware และบริษัทชั้นนำอื่นๆ เข้ามา เรามีปริญญาเอกด้านการเรียนรู้ของเครื่องจักร ผู้เชี่ยวชาญด้านผลิตภัณฑ์จากบริษัทเทคโนโลยีชั้นนำ คุณสามารถตรวจสอบภูมิหลังเหล่านี้ได้ในเว็บไซต์ของเรา ผู้ก่อตั้งสนับสนุนแนวทางนี้ โดยเข้าใจว่าการเปลี่ยนผลิตภัณฑ์ให้กลายเป็นธุรกิจจริงนั้นต้องมีบุคลากรที่เคยทำมาก่อน การสนับสนุนของพวกเขาในการเปลี่ยนแปลงครั้งนี้มีความสำคัญอย่างยิ่งต่อความสำเร็จของเรา อย่าลืมกดไลค์กดแชร์เรื่องราวนี้! ผู้เขียนนี้เป็นผู้สนับสนุนอิสระที่เผยแพร่ผ่านของเรา HackerNoon ได้ตรวจสอบรายงานแล้ว แต่คำกล่าวอ้างในที่นี้เป็นของผู้เขียน #DYOR การเปิดเผยผลประโยชน์ที่ได้รับ: โปรแกรมบล็อกธุรกิจ