DGX Spark của Nvidia chính thức được bán hôm nay và @lmsysorg đã thực hiện một bài kiểm tra hiệu suất tuyệt vời so với các hệ thống khác.
Tóm lại, đây là một hệ thống rất hữu ích cho các mô hình nhỏ hơn và có hiệu suất gần giống với các thiết bị của Apple (ví dụ: Mac Mini M4 Pro), nhưng giá của nó là 4.000 đô la so với 1.400 đô la cho Mac Mini M4 Pro. Nó cũng không mạnh mẽ bằng các GPU chuyên dụng hơn như RTX 5090.
Đáng để đọc và xem bài đánh giá đầy đủ trong bài viết gốc.
🚀 Đánh giá chi tiết về NVIDIA DGX Spark của SGLang đã CÓ MẶT!
Nhờ vào chương trình truy cập sớm của @NVIDIA, SGLang lần đầu tiên xuất hiện trong một sản phẩm tiêu dùng, DGX Spark hoàn toàn mới.
Bộ nhớ thống nhất 128GB và kiến trúc Blackwell của DGX Spark thiết lập một tiêu chuẩn mới cho việc nguyên mẫu AI cục bộ và điện toán biên. Chúng tôi rất vui mừng khi mang đến những thông tin hiệu suất tiên tiến và hỗ trợ phần mềm này cho cộng đồng phát triển.
Đánh giá của chúng tôi đi sâu vào cách triển khai và tăng tốc hiệu quả các mô hình lớn như Llama 3.1 70B, GPT-OSS bằng cách sử dụng giải mã suy đoán EAGLE3 của SGLang và @Ollama trên sản phẩm kỹ thuật tuyệt đẹp này.
👇 Video mở hộp và blog công nghệ trong chủ đề
#SGLang #NVIDIA #SparkSomethingBig #Blackwell #DGXSpark #AIInference #LLMServing
Thông thường, việc sản xuất một bộ phim Hollywood tốn khoảng ~$60 triệu, với Sora 2 Pro HD, bạn chỉ cần $2,700 cho một bộ phim dài 90 phút (hoặc $540 cho Sora 2 tiêu chuẩn)
Ngay cả khi bạn giả định tỷ lệ thành công của clip là 1%, chi phí vẫn chỉ là $270k (hoặc $54k).
Sora-2 cảm giác như là gần nhất để có thể tạo ra các clip, quảng cáo và có lẽ thậm chí là phim (với một chút nỗ lực).
Nó cũng khá cạnh tranh trên thị trường, tôi biết nó đang được thử nghiệm tại @arena (xem máy chủ Discord của họ) nên sẽ rất tốt nếu thấy được điểm số, nhưng tôi có thể thấy sự khác biệt lớn so với các mô hình khác, đặc biệt là khả năng tạo ra một câu chuyện mạch lạc và thường là hài hước.