Нейросеть GPT-4o успешно решила логическую задачу

Похоже, последняя версия ChatGPT — GPT-4 Omni это действительно шаг вперед в развитии искусственного интеллекта. Всего месяц назад, 22 апреля, я опубликовал здесь статью, в которой привел результаты тестирования четырех известных нейросетей (включая GPT-3.5). Им было предложено решить совсем несложную задачу на элементарную логику, и все они этот тест с треском провалили. Правда, «Алиса» (YandexGPT) сразу прямо ответила, что решать логические задачи не обучена. За это разработчикам от Яндекса респект — научили свой продукт не обманывать пользователей и отвечать честно. Кому интересно, перейдите по ссылке и почитайте.

На этот раз я решил не мучить другие нейронки, а провести испытание только для новой GPT-4o. Не далее как в прошедшую пятницу я уже тестировал ее способность распознавать  изображения на фотографиях (читайте об этом здесь). То задание она выполнила вполне успешно. Стало интересно, справится ли она с задачей в той области, в которой когнитивные способности ее предшественников оказались не на высоте.

Как и в прошлый раз, для чистоты эксперимента задачу придумал сам 🤠. Ее героями стали персонажи известного фильма «Белое солнце пустыни». Вот ее условия:

Верещагин, Сухов, Петруха и Абдулла сели обедать. Главным блюдом была черная икра.
Самый старший из них вообще не стал есть икру (сказал, что вчера так объелся ей, что смотреть на икру больше не может). Остальные участники обеда съели, соответственно, 0,5 кг, 1 кг и 2 кг икры.
Трое из них женаты, один холост.
Холостой съел больше, чем Абдулла.
Абдулла съел икры больше, чем Сухов.
Сухов съел меньше, чем самый младший.
Петруха младше Верещагина.
Женатые участники обеда вместе съели икры на 0,5 килограмма меньше, чем самый младший.
Кто сколько съел черной икры?

Сначала прведу мое собственное решение — это простые логические рассуждения, можно сказать, «на пальцах». СПОЙЛЕР!!! GPT-4 Omni применила более научный подход. Но — обо всем по порядку.


Решение от Actum Est:

О Сухове известно, что он съел меньше, чем самый младший. Здесь ключевое слово «съел» — сколько-то он съел, следовательно он не самый старший (который от икры отказался). Если Сухов съел меньше кого-то другого (сейчас не важно, кого именно), а максимально съеденное кем-то количество икры — 2 кг, то возможных вариантов для Сухова всего два — он мог съесть 0,5 или 1 кг.

Абдулла — он съел больше Сухова. Значит, возможные варианты для Абдуллы — 1 или 2 кг.

Но мы также знаем, что холостой съел больше, чем Абдулла. Следовательно, Абдулла не мог съесть максимальную порцию 2 кг, и остается единственный вариант — Абдулла съел 1 кг. Попутно делаем вывод, что холостой съел 2 кг, и он — не Абдулла (т. е. Абдулла женат).

Вернемся к Сухову. Абдулла съел 1 кг икры, а раньше мы определили, что Сухов мог съесть или 0,5, или 1 кг. Следовательно, порция в 1 кг для Сухова не подходит, и он съел 0,5 кг икры.

Также мы уже выяснили, что холостой съел 2 кг. Получается, что Сухов женат, т.к. его порция — 0,5, а не 2 кг.

Идем дальше. По условию задачи «женатые участники обеда вместе съели икры на 0,5 килограмма меньше, чем самый младший». Вывод: самый младший съел самую большую порцию 2 кг, а, как уже было определено, 2 кг съел холостой. Следовательно, холостой — он же и самый младший.

Остались Верещагин и Петруха — что с ними?

Очевидно, кто-то из них съел 2 кг, а кто-то отказался от икры — иного не остается, т. к. порции 0,5 и 1 кг уже нашли своих «хозяев».

Известно, что Петруха младше Верещагина, значит Верещагин — это и есть самый старший в компании едоков. Он не стал ничего есть, а Петруха съел больше всех — 2 кг.

Ответ:

Верещагин — 0 кг (отказался есть икру);
Сухов — 0,5 кг;
Петруха — 2 кг;
Абдулла — 1 кг.


Решение от GPT-4 Omni:

Для решения этой задачи давайте поэтапно проанализируем условия и выводы.

### Условия:
1. Четыре человека: Верещагин, Сухов, Петруха и Абдулла.
2. Самый старший не ел икру.
3. Три человека съели 0.5 кг, 1 кг и 2 кг икры.
4. Трое из них женаты, один холост.
5. Холостой съел больше, чем Абдулла.
6. Абдулла съел больше, чем Сухов.
7. Сухов съел меньше, чем самый младший.
8. Петруха младше Верещагина.
9. Женатые вместе съели на 0.5 кг меньше, чем самый младший.

### Перевод условий в алгебраические выражения и логические выводы:
— Пусть X, Y, Z, W — количество съеденной икры Верещагиным, Суховым, Петрухой и Абдуллой соответственно. Один из них (самый старший) съел 0 кг икры. Т.е., \(X, Y, Z, W \in \{0, 0.5, 1, 2\}\).
— Условие: Холостой съел больше, чем Абдулла. Т.е., холостой не может съесть меньше, чем Абдулла.
— Условие: Абдулла съел больше, чем Сухов. Т.е., \(W > Y\).
— Условие: Сухов съел меньше, чем самый младший. Самый младший съел наибольшее количество икры среди остальных (кроме старшего).
— Условие: Петруха младше Верещагина. Значит, Верещагин старше Петрухи.
— Условие: Женатые вместе съели на 0.5 кг меньше, чем самый младший.

### Анализ вариантов:
1. Начнем с того, кто мог быть самым старшим, а следовательно, не ел икру:
— Если Верещагин самый старший, он съел 0 кг икры. Тогда Петруха младше его и съел одну из оставшихся порций (0.5 кг, 1 кг или 2 кг).

2. Рассмотрим возможные комбинации:
— Если Верещагин — 0 кг, Петруха должен быть младше и съесть икры. Тогда варианты для Петрухи: 0.5 кг, 1 кг или 2 кг.

### Подстановки:
Предположим, что Петруха съел 2 кг икры (он самый младший, так как должен съесть больше всех).

Тогда:
— Верещагин = 0 кг
— Петруха = 2 кг
— Остаются 0.5 кг и 1 кг для Сухова и Абдуллы.

По условиям:
— Абдулла съел больше Сухова (\(W > Y\)), значит:
— Абдулла = 1 кг
— Сухов = 0.5 кг

Теперь проверим условия:
— Холостой съел больше, чем Абдулла. Холостой должен съесть 2 кг, т.е. это Петруха.
— Женатые (Верещагин, Сухов, Абдулла) вместе съели: 0 + 0.5 + 1 = 1.5 кг, что на 0.5 кг меньше, чем съел Петруха (2 кг).

### Итог:
— Верещагин = 0 кг
— Сухов = 0.5 кг
— Петруха = 2 кг
— Абдулла = 1 кг

Таким образом, правильное распределение икры:
— Верещагин: 0 кг
— Сухов: 0.5 кг
— Петруха: 2 кг
— Абдулла: 1 кг


Красиво?! Присутствует и словесная логика, и использован простенький математический аппарат. Что самое важное — нейросеть в собственных рассуждениях не запуталась и решила задачу правильно. В моей практике (правда, не особенно большой), это первый случай. Конкуренты, вероятно, скоро подтянутся, но пока Chat GPT-4 Omni приятно удивляет.

P.S. Не пытайтесь это повторить! Осетровая икра — дорогостоящий продукт, но  вполне допускаю, что Вы располагаете средствами для покупки 2 кг этого деликатеса. Так вот, слопать сразу 2 килограмма черной икры (да хотя бы и красной! 🥵) — чревато самыми печальными и непредсказуемыми последствиями для желудочно-кишечного тракта 🤢. Вобщем, теперь Вы в курсе… …

Top.Mail.Ru