Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

BioAIDevs
Xây dựng thế hệ các nhà khoa học AI tiếp theo.
Các tác nhân AI đang bắt đầu thực hiện phân tích sinh học thực sự: kiểm tra các tập dữ liệu, chạy các quy trình tính toán và sản xuất các kết quả nghiên cứu có giá trị.
Khi AI cho khoa học tiến gần hơn đến việc sử dụng thực tế trong các phòng thí nghiệm, câu hỏi về cách đánh giá hiệu quả các tác nhân sinh học trở nên ngày càng quan trọng.
BixBench Verified 50 là một danh sách câu hỏi được chọn lọc để đánh giá các tác nhân sinh học trong nhiều lĩnh vực sinh tin học.
Chúng tôi đã thử nghiệm BIOS AI Scientist trên BixBench Verified 50 cùng với các tác nhân AI đa mục đích và chuyên ngành.
BIOS dẫn đầu với độ chính xác 90% cùng với K-Dense.
Theo sau là:
> Biomni Labs - 88.7%
> Edison Scientific - 78.0%
> Claude - 65.3% &
> OpenAI Agents SDK - 61.3%
Xem đầy đủ kết quả:
Một điểm rút ra quan trọng: việc đánh giá các tác nhân sinh học không chỉ là xem quy trình phân tích có chạy đúng hay không.
Trong một nhiệm vụ chuẩn, tác nhân đã tính toán các mối tương quan đúng, nhưng đã hiểu sai ý nghĩa sinh học của một cột dữ liệu.
Kết quả: phân tích đúng về mặt số học, nhưng kết luận lại bị đảo ngược về mặt sinh học.
Khi các tác nhân sinh học chuyển từ các chuẩn mực kiểm soát sang các môi trường khoa học thực tế, chúng ta cần đánh giá quy trình làm việc, giả định và lý luận, không chỉ là xem câu trả lời cuối cùng có đúng về mặt số học hay không.
Đọc thêm trong bài viết trên blog của chúng tôi:

33
Giới thiệu về BIOS API: Biến Đại lý của bạn thành Nhà nghiên cứu Khoa học
Hôm nay chúng tôi ra mắt BIOS API - cung cấp cho các nhà xây dựng đại lý và nhà phát triển quyền truy cập trực tiếp vào cùng một công cụ nghiên cứu khoa học tương tác mà điều khiển ứng dụng web BIOS, thông qua REST và MCP.
Nghiên cứu Khoa học Sâu cho Các Nhà Xây Dựng Đại Lý
Bắt đầu một phiên nghiên cứu chỉ với một cuộc gọi.
Chọn chế độ của bạn:
• Lái xe (1 lần lặp tại một thời điểm)
• Bán tự động (tối đa 5 chu kỳ)
• Hoàn toàn tự động (tối đa 20 chu kỳ, ~8 giờ)
Mỗi phiên trả về một trạng thái nghiên cứu sống:
Mục tiêu. Giả thuyết. Phát hiện. Nhận thức. Tập dữ liệu.
Cùng với các đầu ra chu kỳ nghiên cứu đầy đủ.
Thông tin khoa học theo yêu cầu, có thể truy cập từ các đại lý, ứng dụng và quy trình làm việc của bạn.
Hạ tầng Bản địa cho Đại lý
📘 Đặc tả OpenAPI 3.1 đầy đủ: tự động tạo khách hàng
🧪 Khu vui chơi API tương tác
🧠 Hỗ trợ máy chủ MCP
Kết nối BIOS trực tiếp với Cursor, Claude Desktop, Windsurf, hoặc bất kỳ khách hàng tương thích MCP nào - và thực hiện nghiên cứu sâu từ trình soạn thảo của bạn.
Chúng tôi cũng đang lên kế hoạch:
• Một kỹ năng ClawHub bao bọc các điểm cuối BIOS để các đại lý @openclaw áp dụng
• Công cụ MCP sâu hơn
• Tích hợp bản địa trên các khung đại lý
Trả tiền theo truy vấn
Chúng tôi đã tích hợp giao thức x402 như một đường ray thanh toán - cho phép các đại lý và ứng dụng thanh toán theo truy vấn ngay lập tức.
Khoa học máy với máy đang đến.
Bạn sẽ xây dựng gì?
Các trợ lý phát hiện thuốc?
Các nhà thám hiểm tuổi thọ?
Các giám sát tài liệu tự động?
Các đại lý thẩm định khoa học?
Hãy cho chúng tôi biết bạn muốn xây dựng gì với BIOS API.
Chúng tôi sẽ DM cho bạn tín dụng miễn phí để bắt đầu xây dựng.
Bắt đầu tại liên kết bên dưới ↓

7
Cập nhật phát triển hàng tuần BIOS #2:
Chế độ Kế hoạch, Tách nhánh, Trích dẫn phong phú & Nhiều hơn nữa
Có gì mới:
• Chế độ Kế hoạch: BIOS đặt ra các câu hỏi làm rõ trước khi bắt đầu, sau đó trình bày một kế hoạch nghiên cứu mà bạn có thể phê duyệt hoặc tinh chỉnh cho đến khi nó phù hợp với ý định của bạn.
• Tách nhánh: Nhân bản các con đường nghiên cứu và tách nhánh theo hướng khác, cho phép bạn điều chỉnh mục tiêu mà không mất đi công việc ban đầu của mình.
• Cải tiến Tạo tài liệu: Đã làm lại quy trình tạo tài liệu để nâng cao độ chính xác và cho phép trích dẫn phong phú hơn.
Sắp tới:
• Suy nghĩ: Cập nhật lý luận theo thời gian thực với khả năng nhìn thấy các nhiệm vụ đang diễn ra.
• Chế độ Trò chuyện v2: Để hỗ trợ tốt hơn trước hoặc sau khi đi sâu vào nghiên cứu.
• OpenAlex + Lập chỉ mục Semantic Scholar: Cho phép các nhà nghiên cứu truy vấn hơn 500 triệu tài liệu.

40
Hàng đầu
Thứ hạng
Yêu thích
