Việc thu thập dữ liệu từ một trang web toàn bộ trước đây mất: Một script Python. Playwright hoặc Selenium. Xoay vòng proxy. Logic giới hạn tốc độ. Xử lý lỗi. 3 giờ để gỡ lỗi tại sao trang 47 lại trả về mã 403. Bây giờ chỉ cần một cuộc gọi API. Mọi startup thu thập dữ liệu web đã huy động hàng triệu để giải quyết vấn đề này giờ chỉ còn là một điểm cuối duy nhất. Mọi freelancer tính phí 500 đô la để "trích xuất dữ liệu trang web" giờ đã mất toàn bộ mô hình kinh doanh của họ cho một lệnh /crawl. HTML. Markdown. JSON. Chọn định dạng của bạn. Không cần script. Không cần trình duyệt. Không đau đầu. Toàn bộ ngành thu thập dữ liệu web vừa được giảm xuống chỉ còn một dòng mã. Ai đó sẽ sử dụng điều này để sao chép trang web của mọi đối thủ cạnh tranh trước thứ Sáu. 💀