Загадка авторского права OpenAI противопоставляет прецедент добросовестного использования «невозможному» препятствию
Это не воровство, если это инновации.
Это один из острых способов описать позицию компаний, занимающихся искусственным интеллектом, которые полагаются на защищенные авторским правом работы в Интернете в качестве вдохновения для своих моделей.
На этой неделе OpenAI, компания, стоящая за меняющим культуру чат-ботом ChatGPT , подробно остановилась на своем публичном аргументе в пользу переосмысления интеллектуальной собственности в эпоху искусственного интеллекта.
В ответ на иск New York Times о нарушении авторских прав против него и Microsoft ( MSFT ), OpenAI попыталась прояснить свой бизнес и мотивы, написав в своем блоге: «Обучение моделей ИИ с использованием общедоступных интернет-материалов является добросовестным использованием, что подтверждается давние и широко признанные прецеденты. Мы считаем этот принцип справедливым по отношению к творцам, необходимым для новаторов и критически важным для конкурентоспособности США».
В ответе на запрос парламента Великобритании в конце прошлого года компания написала: «Поскольку авторское право сегодня распространяется практически на все виды человеческого выражения, включая сообщения в блогах, фотографии, сообщения на форумах, фрагменты программного кода и правительственные документы, оно будет невозможно обучить ведущие сегодня модели ИИ без использования материалов, защищенных авторским правом».
Что делает аргументы OpenAI интересными и важными, так это новизна дискуссии.
Неясно, в какой степени существующий закон об авторском праве касается ИИ и процесса использования существующих материалов для обучения мощных моделей, направленных на создание и получение новых типов ценностей.
Но в технологической отрасли шаг, который сейчас кажется знакомым, заключается в том, что компании, занимающиеся искусственным интеллектом, действуют так, как будто их разрешительная интерпретация закона является естественным способом взаимодействия, и как будто ограничения не применяются к ним, пока не будет доказано, что они неправы.
Этот маневр напоминает компании, занимающиеся социальными сетями, которые уклоняются от ответственности за реальную модерацию, одновременно пожиная плоды публикации контента других людей. Это также напоминает первые дни совместного использования поездок и экономики свободного заработка, когда популярные приложения стремились завоевать долю рынка, действуя в условиях юридического вакуума .
И поскольку обе отрасли продолжают процветать, а закон остается неурегулированным, компании, занимающиеся искусственным интеллектом, должны задаться вопросом: зачем действовать легкомысленно, когда неизбежность на вашей стороне?
Чтобы успокоить обеспокоенность по поводу нарушений, OpenAI наращивает усилия по установлению партнерских отношений с большим количеством издателей. CNN, Fox Corp. и Time входят в число СМИ, которые в настоящее время ведут переговоры с ИИ-компанией о предоставлении доступа к их контенту.Об этом сообщило агентство Bloomberg.Четверг.
Но модель лицензирования создает ряд препятствий помимо потенциально обременительных затрат.
Саша Луччиони, научный сотрудник Hugging Face, стартапа в области искусственного интеллекта, говорит, что навязывание новой парадигмы компаниям, занимающимся искусственным интеллектом, потребует масштабного пересмотра того, как технологи обучают и используют свои модели.
До сих пор компании, занимающиеся искусственным интеллектом, в основном шли по пути пылесоса в Интернете для обучения большим языковым моделям или LLM, не слишком задумываясь об авторском праве, фильтрации и лицензировании. Переориентация этого процесса на тщательное курирование, согласие и раскрытие информации по сути несовместима с существующим процессом.
Луччиони сказал, что применение более осторожного подхода не является невозможным, но это будет огромная задача. «По сути, это будет возвращение к чертежной доске для получения степени магистра права», – сказала она.
Если LLM обычно опирается на огромные объемы данных сомнительного происхождения, новый путь заставит компании задуматься о новых способах обучения ИИ, используя гораздо меньшие объемы данных — небольшие языковые модели, если хотите.
Джек Стилго, профессор политики в области науки и технологий в Университетском колледже Лондона, сказал, что ответ OpenAI подчеркивает классическое напряжение среди тех, кто называет себя революционерами в сфере технологий: чтобы заслужить доверие общественности, новички должны доказать, что они играют по правилам, одновременно позиционируя себя как правила. -разрушители, прокладывающие путь к инновациям.
Стилго сказал, что компании, занимающиеся искусственным интеллектом, вероятно, осознают это несоответствие, но видят, что технологии развиваются настолько быстро, что закон просто не успевает за ними. Вот что делает судебные дела такими важными. Если правообладатели продолжат настаивать на своих проблемах, они поставят под угрозу всю структуру систем LLM. «Это может разрушить весь карточный домик», — сказал он.
Но применение традиционной интерпретации закона об авторском праве к новому использованию ИИ может привести к другим порочным последствиям. Если модели ИИ будут отгорожены от самых авторитетных источников, таких как заслуживающие доверия новостные агентства или крупные научные публикации, будущие LLM могут оказаться еще менее заслуживающими доверия и надежными, деградируя из-за воздействия некачественных источников.
Эти риски усугубляются существующимиопасения по поводу дезинформации и «галлюцинаций,”, в котором инструменты искусственного интеллекта представляют ложную информацию как факт со всей уверенностью всезнающего антропоморфизированного компьютера.
«В мире, где асимметрия информации имеет большее значение, чем когда-либо», — сказал Стилго, — «вы можете себе представить, что эти проблемы только растут, в которых LLM выступают посредниками и ускоряют доступ людей к информации».