NYT cho biết trong hồ sơ gửi lên Tòa án quận phía Nam New York của Mỹ rằng, họ đang tìm cách buộc Microsoft và OpenAI phải chịu trách nhiệm về “hàng tỷ đô la thiệt hại theo luật định và thực tế” mà họ tin rằng mình phải chịu “sự sao chép bất hợp pháp và sử dụng các tác phẩm có giá trị riêng biệt”.
Tờ báo này cho biết trong một tuyên bố gửi qua email rằng, họ “công nhận sức mạnh và tiềm năng của trí tuệ nhân tạo đối với công chúng và báo chí”, nhưng tài liệu báo chí phải được sử dụng vì lợi ích thương mại với sự cho phép của nguồn ban đầu.
“Những công cụ này được xây dựng và tiếp tục sử dụng báo chí độc lập cũng như nội dung sẵn có vì chúng tôi và các đồng nghiệp của chúng tôi đã báo cáo, chỉnh sửa và xác minh tính xác thực của nó với chi phí cao và có kiến thức chuyên môn đáng kể”, tờ báo này cho biết.
“Luật bản quyền đã được giải quyết sẽ bảo vệ hoạt động báo chí và nội dung của chúng tôi. Nếu Microsoft và OpenAI muốn sử dụng sản phẩm của chúng tôi cho mục đích thương mại, luật pháp yêu cầu họ trước tiên phải xin phép chúng tôi. Họ đã không làm như vậy”, tờ báo này cho biết.
Một đại diện của OpenAI cho biết: “Chúng tôi tôn trọng quyền của người sáng tạo và chủ sở hữu nội dung và cam kết hợp tác với họ để đảm bảo họ được hưởng lợi từ công nghệ AI và các mô hình doanh thu mới… Các cuộc trò chuyện của chúng tôi với New York Times đã diễn ra hiệu quả và tiến triển theo hướng xây dựng, vì vậy chúng tôi rất ngạc nhiên và thất vọng với diễn biến này. Chúng tôi hy vọng rằng, chúng tôi sẽ tìm ra cách hợp tác cùng có lợi, như chúng tôi đang làm với nhiều nhà xuất bản khác”.
Vi phạm bản quyền hàng loạt
NYT là một trong nhiều tổ chức truyền thông đang đòi bồi thường từ các công ty đứng sau một số mô hình AI tiên tiến nhất vì bị cáo buộc sử dụng nội dung của họ để đào tạo cho các chương trình AI.
OpenAI là người tạo ra ChatGPT, một mô hình ngôn ngữ lớn có thể tạo ra nội dung giống con người để đáp lại yêu cầu của người dùng. ChatGPT đã sử dụng hàng tỷ thông tin có giá trị được lấy từ dữ liệu web công cộng cho đến năm 2021.
Các nhà xuất bản truyền thông và người sáng tạo nội dung nhận thấy tài liệu của họ đang được sử dụng và mô phỏng lại bởi các công cụ AI tạo sinh như ChatGPT, Dall-E, Midjourney và Stable Diffusion. Trong nhiều trường hợp, nội dung mà chương trình tạo ra có thể trông giống với tài liệu nguồn.
NYT đã cáo buộc Microsoft và OpenAI tạo ra một mô hình kinh doanh dựa trên “vi phạm bản quyền hàng loạt”, và tuyên bố rằng hệ thống AI của các công ty đã “được sử dụng để tạo ra nhiều bản sao tài sản trí tuệ của NYT nhằm mục đích tạo ra những mô hình GPT để khai thác và, trong nhiều trường hợp, giữ lại phần lớn biểu hiện có bản quyền có trong các tác phẩm đó”.
Các nhà xuất bản lo ngại rằng, với sự ra đời của các chatbot AI tạo sinh, sẽ có ít người truy cập vào các trang tin tức hơn, dẫn đến lưu lượng truy cập và doanh thu bị thu hẹp.
Trong một ví dụ, hồ sơ của NYT cho thấy phần mềm của OpenAI tạo ra văn bản gần như giống hệt với một bài báo của NYT về các hoạt động cho vay nặng lãi trong ngành taxi ở thành phố New York.
Trong vụ kiện của mình, NYT cho biết các mô hình GPT của Microsoft và OpenAI cạnh tranh trực tiếp với nội dung của họ.
NYT cũng cáo buộc các mô hình Microsoft và OpenAI sản xuất nội dung tương tự như nội dung do tờ báo này tạo ra và việc họ sử dụng nội dung của NYT để đào tạo LLM mà không có sự đồng ý “là hành vi tự do dựa trên những nỗ lực đáng kể và đầu tư nhân lực của NYT để thu thập thông tin này”.