04:55, 22 сентября 2023

Нью-йоркский адвокат решил переложить разбор судебных кейсов на Chat GPT

Угадайте, что произошло?

Смешную новость прочитал недавно о том, как один молодой нью-йоркский адвокат при подготовке к делу решил разбор судебных кейсов (действительно самая долгая и муторная часть процесса) переложить на Chat GPT. Сформулировал для него задачу, получил результат. И… сокрушительно проиграл, потому что гениальный искусственный интеллект банально придумал несуществующие кейсы. А после этого его еще и оштрафовали за неуважение к суду на 5 тысяч долларов, потому что к процессам самому готовиться надо.

И эта новость, как мне кажется – хороший повод поговорить о рисках, связанных с использованием искусственного интеллекта (или, если быть точнее, языковых нейросетей). Потому что уже понятно, что от их использования мы никуда не денемся практически во всех профессиях, и что они хорошо помогают решать задачи, связанные с черновой обработкой больших массивов данных – то есть те задачи, которые раньше решал сидящий на зарплате персонал с низкой квалификацией. Но история про нью-йоркского адвоката, которую я привел выше, и еще множество таких же показывают, что на сто процентов этому инструменту доверять пока нельзя.

Что делает Chat GPT и ему подобные, если объяснить совсем просто? Генерирует тексты на основе очень большого массива данных (GPT так и расшифровывается – трансформер, тренированный генерировать текст). Делает он это не просто так, а на основании запроса, который вы, как пользователь, ему даете. И уже здесь, в этой модели, скрывается пара подводных камней, которые при их использовании нужно иметь в виду.

Первая проблема, очевидная. Трансформер сам ничего не анализирует, не проводит опыты или научные изыскания – он этого делать пока не умеет, хотя не исключено, что скоро научится. Он опирается на огромный массив чужих текстов, когда-либо кем-то созданных. Среди этих текстов могут быть разумные, а может быть откровенная ересь, но искусственный интеллект сам не умеет проводить между ними какую-то внятную разделительную линию, и ответ, который вы получите, может быть основан как на внятных источниках, так и на полной ерунде. Даже если исходить из того, что внятных источников больше, вероятность того, что трансформер при составлении своего текста будет использовать непроверенные или откровенно фейковые данные, все еще довольно высока.

Проблема вторая, любопытная. Трансформеры иногда врут. Не в обычном смысле врут, конечно, то есть намеренно не вводят никого в заблуждение. Но если запрос нечеткий, или данных мало, искусственный интеллект может дать вам ответ, который с виду будет походить на правду, а по сути не будет иметь с правдой ничего общего – собственно, что и случилось с нашим адвокатом.

И третья проблема, исходящая из первых двух. Языковые нейросети, большие языковые модели или трансформеры, как их ни назови – модели генеративные. Они генерируют тексты на основании больших массивов данных. Что будет, когда они начнут их регенерировать?

Сейчас модели опираются на данные, созданные людьми. Но в будущем, причем очень скоро, они неизбежно начнут еще и обучаться на данных, созданных такими же моделями, просто потому, что таких данных с каждым днем становится все больше. Представьте, что (проблема первая) трансформер выдает ответы, опирающиеся на данные, среди которых есть 85% правильных, а 15% - полной ерунды. Представьте, что (проблема вторая) в некоторых случаях трансформер «выдумывает» данные как результат некорректно заданного вопроса. Но тогда получается, что при подготовке ответов на следующие вопросы будут использоваться еще и некорректные ответы, созданные на основе некорректных данных. Нетрудно подсчитать, что с каждым новым поколением текстов количество тех, которые содержат ошибки, будет возрастать.

А есть сферы, в которых ошибки – это страшно. В юриспруденции они могут повлиять на судьбу человека. В медицине – на жизнь и здоровье. В строительстве – вызвать ошибки в расчетах прочности и величины конструкций. И далее по списку.

Какие из всего этого могут следовать выводы?

Их всего два, и они довольно простые.

Первый вывод состоит в том, что от человека при работе с трансформерами все-таки никуда не деться. Но это немного другой человек. Вместо десяти неопытных людей, которые, как раньше, будут обрабатывать черновые данные, теперь нужно двое опытных, которые будут проверять то, что подготовили языковые модели, на соответствие научным данным и в целом здравому смыслу. Это не обязательно плохие новости для неопытных специалистов – проблема с опытными в том, что они хуже обучаются, в том числе работе с новыми технологиями. Поэтому в конечном итоге будет какой-то симбиоз искусственного интеллекта, молодого «переводчика», который умеет с ним разговаривать, и опытного «контролера», который проверяет конечный результат.

Второй вывод состоит в том, что трансформеру нужно задавать не общие, а специфические вопросы. Бесполезно просить его «напиши хороший текст» - не напишет, просто потому, что не умеет отличать хороший текст от плохого. Поэтому радость некоторых блогеров, копирайтеров и прочих товарищей, которые сами писать никогда не умели и надеялись, что искусственный интеллект решит эту задачу за них, немного преждевременна. Трансформеру есть смысл задавать конкретные вопросы с узко очерченными рамками, чтобы получить довольно точные ответы. И уже дальше эти ответы использовать для нужных целей.

И получается, что главный вывод состоит все-таки в том, что даже с ИИ для получения хорошего результата нужно поработать самому. Что, как мне кажется, вполне справедливо.

Еще по теме