Скандал с удалением данных: Times обвиняет OpenAI в уничтожении доказательств

2 часа(ов) назад 6

OpenAI восстановила данные, но Times утверждает, что они бесполезны без оригинальной структуры

Борьба за авторские права между The New York Times и OpenAI, поддерживаемой Microsoft, обострилась на минувшей неделе, когда Times заявила, что инженеры OpenAI «случайно удалили данные, которые команда газеты собирала в течение более 150 часов в качестве потенциальных доказательств».

OpenAI удалось восстановить большую часть данных, но юридическая команда Times утверждает, что оригинальные имена файлов и структура папок отсутствуют. Согласно заявлению, поданному в суд в среду Дженнифер Б. Майзел, адвокатом газеты, это означает, что информация «не может быть использована для определения того, где скопированные статьи истцов новостей» могли быть включены в модели искусственного интеллекта OpenAI.

Представитель OpenAI Джейсон Дейтром заявил: «Мы не согласны с высказанными характеристиками и вскоре предоставим свой ответ». The New York Times отказалась от комментариев.

Times обвиняет OpenAI в уничтожении доказательств

В прошлом году Times подала иск о нарушении авторских прав против OpenAI и Microsoft, утверждая, что компании незаконно использовали её статьи для обучения инструментов искусственного интеллекта, таких как ChatGPT. Это дело является одним из многих продолжающихся юридических баталий между компаниями ИИ и издателями, включая аналогичный иск, поданный Daily News.

В настоящее время дело Times находится в стадии раскрытия, суд потребовал от OpenAI показать Times свои данные обучения. Чтобы выполнить это требование, OpenAI создала «песочницу» из двух «виртуальных машин», которые юристы Times могли изучить. Однако, по словам Майзел, инженеры OpenAI «стёрли» данные, организованные командой Times на одной из этих машин.

OpenAI признала, что информация была удалена, и попыталась решить проблему вскоре после того, как была предупреждена об этом в начале этого месяца. Но когда юристы газеты посмотрели на «восстановленные» данные, они оказались слишком неорганизованными, что заставило их «воссоздать работу с нуля, используя значительные человеко-часы и время компьютерной обработки», — заявили несколько других юристов Times в письме, поданном судье в тот же день, что и заявление Майзел.

Юристы отметили, что у них «нет оснований полагать», что удаление было «намеренным». В электронных письмах, приложенных к письму Майзел, адвокат OpenAI Том Горман назвал удаление данных «сбоем».

Это не первый спор такого рода в иске. В течение последнего года Times и технологические компании боролись за то, какая сторона должна нести ответственность за сортировку обучающих данных. Юристы газеты заявили, что OpenAI находится в лучшем положении, чтобы сделать это.

The Times также недавно подтолкнула OpenAI и Microsoft к предоставлению сообщений Slack, текстовых сообщений и разговоров в социальных сетях между рядом ключевых фигур OpenAI. На прошлой неделе The New York Times подала ещё одно письмо с просьбой к суду обязать Microsoft и OpenAI поделиться дополнительными материалами.

Тем временем Microsoft потребовала, чтобы The New York Times передала все документы, связанные с её использованием генеративного ИИ, включая информацию об обозревателе в области технологий Кевине Рузе.

Пока это дело и другие подобные ему проходят через суды, OpenAI стремится заключить соглашения о лицензировании контента с другими издательствами. В медиа и юридических кругах нет единого мнения о том, как разрешится это дело, но они создадут важный прецедент для того, как индустрия ИИ может работать в Соединённых Штатах.

Читать всю статью