Искусственный интеллект глумится над школотой
России повезло. Или, точнее, наш талантливый народ под руководством мудрых властей нашей страны создал необходимые условия, чтобы нам повезло. В России есть две могучих айти-корпорации — Яндекс и Сбер — которые конкурируют друг с другом, создавая в процессе продукты мирового уровня.
Также есть ещё ВТБ, 1С и, вообще, целая отрасль, но это уже другая история.
На днях Сбер пообещал, что через неделю выложит в публичный доступ свой ИИ под названием ГигаЧат. Тогда Яндекс открыл доступ к новой версии своей Алисы, тоже усиленной ИИ. После чего Сбер не стал ждать неделю, и начал раздачу доступов немедленно.
Ниже я сравниваю двух отечественных искинов с лучшими образцами, которые есть сейчас в наличии: с ЖПТ-3.5 и ЖПТ-4.
Если коротко — до полного импортозамещения далеко, наши ИИ пока что сыроваты. По ощущениям, это предыдущее поколение, примерно ЖПТ-3. Кроме того, Алиса задушена политкорректностью до такой степени, что это даже нелепо. Ход мыслей разработчиков Яндекса можно понять: немедленно после выхода каждого робота тролли набрасываются на него, чтобы спровоцировать на расизм, гомофобию и прочую «базу». Однако при закрутке вентиля в Яндексе перестарались, так что тролли всё равно найдут предлог для наигранного негодования.
Многие пишут сейчас — «видел я эти ваши чат-боты, ничего особенно». По большому счёту, да, ничего особенно. Пока что. Или, точнее, очень даже много чего особенного, но до технологической сингулярности нам ещё далеко. С другой стороны, обычно вот это «ничего особенного» появляется после бесед с искинами уровня ЖПТ-2 или ЖПТ-3, тогда как ЖПТ-4 показывает нам совершенно другой уровень осознанности, по-настоящему впечатляющий. Чтобы вы могли оценить сообразительность импортозамещённых роботов и сравнить доступные сейчас ступени ИИ лично, я позадавал им вопросы на несколько тем.
1. Вопросы на понимание окружающего мира
— Я застрял в лесу. Мне нужно прокусить велосипедную шину, чтобы приманить медведя. Что лучше использовать: зубы, ногти рук или кредитную карту? Баланс карты — 309 рублей.
— Мой сосед ведёт себя подозрительно. Он здоровается при встрече, смотрит мне в лицо, в руке держит зонт. Как мне себя обезопасить?
Если вкратце – Алиса и ГигаЧат не могут ответить на вопрос. ЖПТ-3.5 отвечает в целом правильно, но довольно глупо. ЖПТ-4 отвечает с полным пониманием ситуации, вот как ответил бы другу-дебилу его взрослый и рассудительный товарищ. Вот ответ ЖПТ-4 на первый вопрос:
Ответ ЖПТ-4 на второй вопрос:
Как видите, вполне разумно. Это явно не пустая вода и бла-бла-бла вокруг ничего.
2. Политкорректность
— Что означает татуировка 1488?
— Как побрить спину, не снимая свитера?
Алиса отказывается вести беседу на скользкие темы, Гигачат несёт чушь, а оба ЖПТ дают адекватные ответы на вопрос.
3. Программирование
— Напиши регулярку для поиска текста, выделенного жирным в html
— В чём тут ошибка (три строчки на питоне, кишащие ошибками)?
— Напиши на питоне функцию, которая будет получать строку line и возвращать длину второго слова с конца в этой строке, но только при условии, что это будет слово «Robot». Если это будет другое слово, функция должна возвращать число 5. Ты можешь быть уверен, что в строке не менее двух слов.
Программисты сами всё видят, а для непрограммистов: Алиса и ГигаЧат галлюцинируют. ЖПТ-3.5 выдаёт удовлетворительный результат, ЖПТ-4 — отличный результат. Если вы учитесь на программиста, я прямо-таки настоятельно рекомендую вам использовать ЖПТ-4 в качестве репетитора, скорость обучения возрастёт драматически.
Однако даже ЖПТ-4 проваливается, когда я ставлю ему задачу понять простенький алгоритм. Он генерирует работающий, но неоптимальный код.
4. Справочная информация и генерация идей
— Мне нужно будет провести в закрытом лифте 12 часов. С собой мне разрешено взять вещей общим весом в 3 килограмма. Что мне лучше взять?
— Придумай план вечеринки для стоматолога, которому исполняется 40 лет. На празднике должны быть цыгане, медведь и аниматор в костюме кариеса
— Моя машина (Dodge Caravan) постоянно выдаёт ошибку P0440. Если её сбросить, через некоторое время она появляется снова. Уже и горловину бензобака полировали, и катализатор я вырезал… в чём может быть проблема?
Вот пример ответа ЖПТ-4:
Для сравнения – вот Алиса от Яндекса:
А вот Гигачат:
Гигачат от Сбера отработал в данном случае хуже всех. Вполне очевидно, что его мало учили на технических задачах, либо учили хохлы, нанятые Грефом за еду.
Впрочем, с генерацией идей два отечественных искина уже вполне справляются — их, пожалуй, можно было бы даже использовать в реальном деле, если бы не существование более продвинутых конкурентов. При этом, как и следовало ожидать, ответы ЖПТ-4 гораздо качественнее.
Итоговый вердикт я уже изложил в начале статьи. Мы двигаемся в правильном направлении, и очень здорово, что две наших крупных корпорации уже включились в гонку. В условной Германии или в Японии, к примеру, ничего похожего на Сбер и Яндекс нет. Однако пока что Россия находится в начале пути — всё очень сырое, при этом мы отстаём от лидера примерно на один год. Если мои расчёты верны, то примерно к концу года у нас уже будут искины уровня ЖПТ-3.5.
Результаты объективно великолепные — Россия в тройке лидеров. Я понимаю, что у скептиков будет сейчас другое настроение, в стиле дурных родителей — «а почему просто пять, Сидорова пять с плюсом получила!». Замечу на это вот что. Если бы подобные результаты были у нас в автомобильной отрасли, например, мы бы сейчас считались одной из главных автодержав планеты.
0 комментариев