579 lượt đọc
579 lượt đọc

Mô hình AI Trung Quốc hứa hẹn hiệu suất cấp độ Gemini 2.5 Pro với một phần tư chi phí

từ tác giả This Week in AI Engineering5m2025/06/23
Read on Terminal Reader

dài quá đọc không nổi

Công ty khởi nghiệp Trung Quốc MiniMax đã trở lại sự chú ý với mô hình lý luận mở mới của họ, MiniMax-M1, và nó không có gì ngoài ấn tượng.
featured image - Mô hình AI Trung Quốc hứa hẹn hiệu suất cấp độ Gemini 2.5 Pro với một phần tư chi phí
This Week in AI Engineering HackerNoon profile picture

Xin chào những người hâm mộ!

Chào mừng bạn đến với phiên bản thứ 24 của"This Week in AI Engineering"!

Tuần này, ánh sáng rực rỡ chiếu sáng vào MiniMax, công ty khởi nghiệp AI Trung Quốc vừa phát hành một mô hình lý luận mở cấp độ biên giới, MiniMax-M1, với một số tiêu chuẩn giảm hàm.Chúng tôi cũng thấy Google giới thiệu một biến thể Flash-Lite mới nhanh hơn và rẻ hơn.Trong khi đó, Kimi-Dev-72B nổi lên như là một trong những mô hình mã hóa mã nguồn mở mạnh nhất bao giờ hết, nhắm mục tiêu các quy trình xử lý trong thế giới thực với kiến trúc hai đại lý.

Như mọi khi, chúng tôi sẽ đóng gói mọi thứ với các công cụ và bản phát hành dưới radar xứng đáng với sự chú ý của bạn.


MiniMax-M1 is INSANE

Startup Trung Quốc MiniMaxM1 hỗ trợ một cửa sổ ngữ cảnh của 1 triệu token, đưa nó vào cùng một lớp như Gemini 2.5 Pro. Nhưng đây là kicker: nhờ kiến trúc Hybrid Mix-of-Experts và cơ chế chú ý sét đánh, nó đạt được cùng chất lượng lý luận như DeepSeek R1 với chỉ 25% chi phí tính toán.

Startup Trung Quốc MiniMax
  • Variants & BenchmarksMiniMax-M1 có hai biến thể: M1-40K và M1-80K, đề cập đến khả năng đầu ra token của họ. Cả hai đều được xây dựng trên cơ sở tham số 456B MiniMax-Text-01, với chỉ 45.9B được kích hoạt mỗi token. kiến trúc MoE làm cho kết luận rẻ hơn và nhanh hơn.
  • On AIME 2024, M1-80K scored 86.0% accuracy. It also logged:
    • 65.0% on LiveCodeBench
    • 56.0% on SWE-bench Verified
    • 62.8% on TAU-bench
    • 73.4% on OpenAI MRCR (4-needle version)
  • Những kết quả này đặt nó trước Qwen3-235B và DeepSeek R1 về các nhiệm vụ lý luận lâu dài và phần mềm.

Training Cost

  • Chi tiết gây sốc nhất là nó đã được đào tạo với giá trị máy tính chỉ 534.700 đô la, sử dụng 512 GPU NVIDIA H800 trong ba tuần. So sánh điều đó với đường ống trị giá 5,6 triệu đô la của DeepSeek hoặc hàng trăm triệu đô la của OpenAI, và bạn nhận ra MiniMax tích cực tối ưu hóa chi phí hiệu quả mà không làm giảm hiệu suất.

Open Access and Developer Features

  • MiniMax-M1 bao gồm gọi chức năng có cấu trúc, chatbots có khả năng tìm kiếm trực tuyến, tạo hình ảnh / video và nhân bản giọng nói thông qua API. Đối với triển khai, nó hỗ trợ vLLM và các nền tảng dựa trên Transformers để phục vụ sẵn sàng cho doanh nghiệp.
  • Đây là một chiến thắng lớn cho các mô hình biên giới truy cập mở, đặc biệt là cho các quy trình làm việc bối cảnh dài và phát triển đại lý.

MiniMax Isn’t Done Yet: Meet Hailuo 02

  • Ngay sau khi thả M1, họ cũng đã phát hành Hailuo 02 , mô hình văn bản video và hình ảnh video tiên tiến nhất của họ, và nó đang chuyển đầu.
  • Với clip dài 6 giây ở độ phân giải 768p và hỗ trợ bản địa cho các lời nhắc chi tiết, Hailuo cung cấp kết quả kết hợp về mặt vật lý, sắc nét về mặt thị giác và dựa trên câu chuyện mà thậm chí còn cạnh tranh với Veo 3 của Google.
  • Điều thực sự làm cho nó khác biệt là điều khiển chuyển động và camera thực tế. Hãy suy nghĩ về trọng lực chính xác, va chạm, hiệu ứng chất lỏng. Và giá cả cũng cạnh tranh. Tại $ 0,25 cho mỗi clip 6s hoặc $ 0,52 cho 10s, nó rẻ hơn hầu hết các mô hình đóng cửa với mức độ trung thành này.
  • MiniMax cũng cung cấp một API với Hailuo, làm cho nó dễ dàng hơn cho các nhà phát triển để tích hợp.Nếu bạn đang xây dựng cho VFX, nội dung điện ảnh, hoặc các công cụ câu chuyện tương tác, đây là một giá trị một thử nghiệm.
Hà Nội 02

Gemini 2.5 Flash-Lite: Google’s Cheapest

Google đã chính thứcGemini 2.5 Pro và Flashcác mô hình lý luận lai này đã được triển khai bởi các đối tác như Snap, Rooms và SmartBear. Nhưng điểm nổi bật thực sự là Gemini 2.5 Flash-Lite mới, hiện đang được xem trước. Nó là mô hình nhanh nhất và rẻ nhất trong gia đình 2.5. Mặc dù vậy, nó vượt trội hơn Gemini 2.0 Flash-Lite về mã hóa, toán học, lý luận, khoa học và tiêu chuẩn đa phương thức.

Gemini 2.5 Pro và Flash

Flash-Lite hỗ trợ:

  • Sử dụng công cụ thông qua thực thi mã và Google Search
  • Đầu vào đa phương thức (text, images, audio)
  • 1 triệu token chiều dài ngữ cảnh
  • Nhiệm vụ chậm trễ thấp, công suất cao như phân loại, dịch và khai thác dữ liệu
  • Mô hình hiện đang hoạt động trong Google AI Studio, Vertex AI và ứng dụng Gemini.Demo đầu tiên bao gồm chuyển đổi PDF thành bảng điều khiển tương tác và tự động hóa các báo cáo phân tích từ văn bản không có cấu trúc.
  • Gemini 2.5 Flash-Lite là một ứng cử viên mạnh mẽ cho các trợ lý AI thời gian thực và công cụ nội bộ khối lượng cao.

The Best Open Coding Model Yet?

Kimi-Dev-72B của Moonshot AIChỉ đạt 60,4% trên SWE-bench Verified, làm cho nó trở thành mô hình mã hóa trọng lượng mở mạnh nhất hiện nay. Điều gì làm cho Kimi-Dev khác biệt là thiết lập đại lý kép của nó.

Kimi-Dev-72B của Moonshot AI
  • BugFixer, xác định và sửa lỗi mã
  • TestWriter, tạo ra các bài kiểm tra đơn vị để xác nhận và ngăn chặn sự hồi quy
  • Cả hai đại lý đều tuân theo một thói quen định vị tệp 2 bước và chỉnh sửa mã chính xác. mô hình được đào tạo trên hơn 150B token của các vấn đề GitHub và PR thực tế, và sau đó được điều chỉnh tốt với việc học tập tăng cường và một cơ chế tự chơi để xử lý các nhiệm vụ gỡ lỗi phức tạp.
  • Điều nổi bật là hệ thống phần thưởng dựa trên kết quả và đường ống đào tạo theo phong cách chương trình giảng dạy, làm tăng tỷ lệ thành công bằng cách lọc các lời nhắc yếu và củng cố các giải pháp chính xác.
  • Nó có sẵn trên GitHub và Hugging Face với trọng lượng mô hình, mã nguồn và báo cáo công nghệ đầy đủ để làm theo.Nếu bạn đang xây dựng công cụ đánh giá mã tự động, gỡ lỗi hoặc các công cụ đại lý nhà phát triển, đây là một đối thủ nghiêm túc.

AI Video Gets Wild: Kling & Midjourney

  • Nếu bạn nghĩ rằng video AI không thể trở nên rực rỡ hơn, hãy đợi cho đến khi bạn thấy điều này. startup Trung Quốc KlingAI đã giảm một Studio Ghibli phong cách ngắn, hoàn chỉnh với kết cấu vẽ bằng tay, chuyển động mơ mộng. Họ cũng chia sẻ một số video ASMR. thời gian, nhịp điệu, SFX phù hợp hoàn hảo.
  • Trong khi đó, Midjourney vừa mở ra mô hình video V1 của mình, biến bất kỳ hình ảnh nào thành một hình ảnh hoạt hình có phong cách. Bạn có thể kiểm soát cường độ chuyển động, chọn chuyển động "giảm" hoặc "giá" và thậm chí điều chỉnh nhịp điệu.
Lời bài hát: Studio Ghibli ShortMô hình video V1

Tools & Releases YOU Should Know About

Nền tảng Unicornlà một trình xây dựng trang web AI-first được thiết kế cho các nhà sáng tạo indie, các công ty khởi nghiệp và các nhà sáng lập SaaS. Nó đi kèm với các mẫu kéo và thả, copywriting được hỗ trợ bởi AI và dịch thuật tích hợp, tất cả được tối ưu hóa cho việc triển khai nhanh chóng. Nền tảng cũng bao gồm SSL, CDN, công cụ SEO và tích hợp cho các biểu mẫu và bản tin. gói miễn phí bao gồm một trang web trực tiếp, trong khi các kế hoạch trả tiền mở khóa các tính năng nhóm và nhiều dự án.

Nền tảng Unicorn

CodingFleet'Python Code Generator hợp lý hóa phát triển bằng cách biến các hướng dẫn ngôn ngữ tự nhiên thành mã sẵn sàng sản xuất thông qua một giao diện trực quan. công cụ này hỗ trợ hơn 60 ngôn ngữ lập trình và khuôn khổ. Người dùng chỉ đơn giản mô tả yêu cầu của họ bằng tiếng Anh đơn giản, và CodingFleet cung cấp các đoạn mã sạch sẽ, có tài liệu với hướng dẫn thực hiện.Nó được xây dựng cho các nhà phát triển muốn đầu ra nhanh chóng, chính xác trên các đống.

CodingFleet

* Đánh giáAirCodum** Cho phép các nhà phát triển tương tác liền mạch với môi trường mã hóa của họ bằng cách sử dụng các lệnh bàn phím cảm ứng, giọng nói và tùy chỉnh. Với AirCodum, người dùng có thể chuyển các tập tin, hình ảnh và đoạn mã giữa các thiết bị di động của họ và VS Code một cách dễ dàng.


Và điều đó bao phủ vấn đề này của "This Week in AI Engineering."

Cảm ơn bạn đã điều chỉnh! Hãy chắc chắn chia sẻ bản tin này với những người đam mê AI đồng nghiệp của bạn và theo dõi để biết thêm cập nhật hàng tuần.

L O A D I N G
. . . comments & more!

About Author

This Week in AI Engineering HackerNoon profile picture
This Week in AI Engineering@thisweekinaieng
We are a weekly podcast and newsletter made to deliver quick and relevant AI Engineering news in just under 4 minutes.

chuyên mục

BÀI VIẾT NÀY CŨNG CÓ MẶT TẠI...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks