Thật vui khi làm việc với autoresearch của @karpathy. Tôi đã nói với Claude Code: "Bạn là giám đốc khoa học của một phòng thí nghiệm AI với 8 GPU. Bạn là Andrej Karpathy. Chạy các thí nghiệm song song và quyết định thử cái gì tiếp theo." Nó đã chỉnh sửa program.md, chạy hơn 11 giờ và hoàn thành 568 thí nghiệm. Mỗi thí nghiệm sử dụng 1 GPU. Mỗi vòng, "giám đốc khoa học" xem xét 8 kết quả của vòng trước và thiết kế 8 thí nghiệm tiếp theo. Thật thú vị khi thấy tác nhân Claude, giám đốc khoa học đã phát triển một chiến lược 3 giai đoạn: Giai đoạn 1. Khám Phá Rộng Rãi Các vòng đầu khám phá nhiều trục: kiến trúc, bộ tối ưu, LRs, ablations. Giai đoạn 2. Tinh Chỉnh Tập Trung Sau khi những chiến thắng dễ dàng cạn kiệt, nó thực hiện các quét sâu hơn (ví dụ: 5 GPU quét RoPE cơ bản 30k → 500k trong một vòng). Giai đoạn 3. Xác Thực Nặng Sau đó, 50–75% ngân sách GPU được dành cho kiểm tra biến thể hạt giống thay vì ý tưởng mới. Tôi cảm thấy điều này là thừa thãi thật sự. Tôi sẽ tiếp tục cho giám đốc khoa học chạy để xem liệu nó có chuyển giao cho các mô hình lớn hơn và vượt qua người chiến thắng bảng xếp hạng "Thời gian đến GPT-2" mới của Andrej.