cloudflare đã dành nhiều năm để chiến đấu với các công cụ thu thập dữ liệu và bán dịch vụ bảo vệ chống bot bây giờ họ đã ra mắt một API /crawl có thể thu thập dữ liệu toàn bộ trang web chỉ với một yêu cầu >gửi một cuộc gọi API duy nhất >cloudflare sẽ render trang cho bạn >trả về nội dung dưới dạng HTML, Markdown hoặc JSON >tự động trích xuất liên kết và các phần tử trang >không cần tự động hóa trình duyệt, không cần kịch bản thu thập dữ liệu Công ty cùng xây dựng một nửa hạ tầng chống thu thập dữ liệu của internet vừa làm cho việc thu thập dữ liệu trở nên dễ dàng hơn Các công ty AI sẽ rất thích điều này