AI sáng ngày 16 tháng giêng 1 kiến trúc mới của Sakana AI-VN source

AI sáng ngày 16 tháng giêng 1 kiến trúc mới của Sakana AI

"Khoa học kỹ thuật bay công bố đầu tiên dựa trên sức mạnh quốc gia của suy luận sâu tiểu thuyết mô hình nhỏ X1" vào ngày 15 tháng 1, khoa học kỹ thuật bay đã phát hành một mô hình lý luận sâu duy nhất trên nền tảng hiện nay của lực lượng quốc gia - tin nổi SAO hỏa X1. Mô hình toán học trung quốc đầu tiên ở châu á, và tiên phong trong việc áp dụng cho giáo dục, y tế và các trường hợp cần thiết. Máy bay của chúng tôi phát hành mô hình suy luận sâu đầu tiên dựa trên năng suất quốc gia. Sakana AI ra đời với mô hình biến hình thích ứng có thể điều chỉnh các trọng lượng một cách năng động để phù hợp với một nhiệm vụ tương tự và tích cực hỗ trợ việc tự học suốt đời. Nhập khẩu các giá trị đặc biệt tinh chỉnh (SVF) công nghệ, so với LoRA truyền thống rõ ràng tăng số lượng tham gia và giảm nguy cơ siêu interpolation, nâng cao mô hình của phụ nữ. Trong toán học, lập trình, nhận thức hình ảnh và các nhiệm vụ khác hiệu quả cải thiện đáng kể, các thí nghiệm cho thấy rằng với điều kiện thử nghiệm giảm hiệu quả là xấu hơn. 2. công việc mới của ChatGPT "nhiệm vụ" trực tuyến: công việc mới của ChatGPT "nhiệm vụ" hỗ trợ người dùng thiết lập nhiệm vụ thời gian, tự động tiếp tục thực hiện nhiệm vụ một lần hoặc định kỳ, sẽ được gửi đến ChatGPT Plus, đội và người dùng Pro. Người dùng có thể cài đặt tối đa 10 nhiệm vụ hoạt động thông qua mô hình "gpt-4o với scheduled tasks", hỗ trợ nền tảng Web, iOS, Android, MacOS, và hỗ trợ đẩy thông báo. OpenAI nói rằng năm 2025 sẽ là năm "Agents" khởi động, cập nhật này là một bước quan trọng để bước vào L3, các chuyên gia mạnh hơn đang được phát triển. 3. MiniCPM-o cập nhật phiên bản 2.6: MiniCPM-o 2, 6 kết nối với kết thúc của kiến trúc toàn mẫu kết nối các mô-đun mã hóa các phương thức khác nhau, tổng số tham chiếu 8B, khả năng đa phương thức chuẩn gpt-4o. Hỗ trợ bố trí bài phát biểu song ngữ tiếng trung và tiếng anh, với các chức năng cao cấp như nhân bản âm thanh, kiểm soát cảm xúc, và tối ưu hóa khả năng hình ảnh như OCR. Thiết kế đổi mới kỹ thuật cho tái sử dụng các cơ chế xử lý chuyển động hoàn chỉnh, có thể thực hiện một mô hình đa phương thức trong thời gian thực trong các thiết bị cuối như iPad. MiniMax mở rộng cập nhật: MiniMax mở rộng: MiniMax mở rộng mô hình ngôn ngữ cơ bản với các thông số trị giá 45.6 tỷ minimax-text-01, mở đầu cơ chế Lightning Attention, hỗ trợ 4 triệu token văn cảnh cực dài. Toàn bộ các mô hình mới cho tiêu chuẩn gpt-4o, Claude 3.5, phá vỡ các mô hình nguồn mở chính thống và nguồn đóng trên nhiều bộ thử nghiệm như HumanEval, GPQA Diamond. Đồng bộ hoá ra mô hình hình ảnh đa phương thức minimax-vl-01, nhóm đang phát triển công nghệ vô hạn kênh văn cảnh, nền tảng cho sự phát triển của các ứng dụng al. 5. Vidu 2.0 phát hành: Vidu 2.0 phiên bản của tốc độ lên đến 10 giây, tăng gấp 3 lần so với trước, cung cấp nhiều thời gian miễn phí không giới hạn chế chế độ sản xuất miễn phí. Tăng cường sự nhất quán của nhiều chủ thể, hỗ trợ di chuyển khuôn mặt của nhân vật và chính xác điều khiển cảnh quay, bytes chuyển tiếp là đơn giản hơn tự nhiên. Có thể duy trì sự cân bằng của mực, phẳng và nhiều phong cách nghệ thuật khác nhau, giá 0.258 nhân dân tệ/giây, có lợi thế trong lĩnh vực hoạt hình al. 6. máy bay dựa trên một mô hình lý luận về lực lượng máy tính trong nước X1: máy bay bay được phát hành bởi một máy tính trong nước lái xe máy bay X1 mô hình lớn, toán học trung quốc đứng đầu trong nước, đã được thực hiện trong trường hợp giáo dục và y tế. Nâng cấp starlight 4.0 Turbo, nhận dạng chính xác hơn 40%, hỗn hợp các chức năng tìm kiếm kiến thức khoa học, tốc độ lỗi giảm 40%. Phiên bản đầu tiên của giọng nói kết nối với nhau, kéo dài tối đa 5 giây, sẽ ra mắt vào năm 2025. 7. Google chính thức thông báo rằng nguồn mở dịch vụ AI AutoGen phát hành phiên bản 0.4: Microsoft AutoGen 0.4 phiên bản hoàn toàn khôi phục lại, giới thiệu cơ chế thông báo dị bộ, tăng thêm sự ổn định của mã, tính phổ biến và khả năng mở rộng. Thêm vào thiết kế mô-đun, nằm giữa hỗ trợ ngôn ngữ và màn hình hiển thị giao diện kéo và kéo, xây dựng các công cụ theo dõi và gỡ lỗi chỉ số, hỗ trợ mở rộng cộng đồng. Một kiến trúc đa cấp của magentic-one có sẵn, bao gồm 5 đặc vụ chuyên nghiệp, phối hợp với người thích hợp để thúc đẩy sự kiện dị biến và thích nghi cao độ. 8. y học O1 tích cực khám phá: ngắn thời gian suy nghĩ: Shanghai jiaotong thông qua kéo dài thời gian suy nghĩ AI, chỉ cần 500 mẫu đào tạo có thể cải thiện độ chính xác của chẩn đoán y tế 6-11%. Bằng cách sử dụng phương pháp đào tạo chuỗi dữ liệu của trí óc dài, LongStep và LongMonolog, để làm cho al bắt chước các bác sĩ chẩn đoán cách suy nghĩ. Để nhận ra các vấn đề y học phức tạp, cần một chuỗi lý luận dài hơn, mô hình tham số lớn được lợi ích từ việc mở rộng thời gian lý luận.