ChatGPT o1-preview может решать загадки быстрее меня, и я его за это ненавижу

Он также дает советы по отношениям и заполняет пробелы в сюжете фильмов.

Когда OpenAI выпустила на этой неделе нашумевшую модель Strawberry для ChatGPT, она хвасталась своими способностями в области сложной логики, такой как программирование, секвенирование генов и квантовая физика, в серии видеороликов. Я верю компании на слово, что модели, называемые o1-preview и o1-mini на ChatGPT, способны на то, что они заявляют. Взлом сложных уравнений и исследование геномов, похоже, не составит для нее труда.

Но, как гордый член клуба логики и загадок моей средней школы, я хотел узнать, как он справляется на моей территории, решая и составляя головоломки и загадки. И тогда я подумал, что мне следует попросить у сверхлогичного ИИ совета по другим, более повседневным вопросам. Может ли он дать дельный совет по отношениям, рассказать, что означает странный шум в машине, и, возможно, даже заполнить сюжетные дыры в фильмах?

Логика да юмор нет

Короткий ответ — да. Модели o1-preview и mini действительно хороши в решении простых и сложных загадок. Я поигрался с обеими, и единственное реальное различие заключалось в количестве дополнительных шагов и, следовательно, скорости mini. Но, хотя они могут быть медленнее, чем GPT-4o, они очень быстро решают эти загадки по сравнению с человеком. Примечательно, что вы можете увидеть, как он раскладывает ответы по разным шагам. Я протестировал его на нескольких моих любимых, включая один из Хоббита . Логика ИИ имела смысл, хотя иногда она была неграмматической, как, например, когда он объяснял взвешивание мясника Майка.

Хорошо, он может справиться с существующими загадками, но может ли он придумать новую? В качестве теста я попросил его придумать забавную загадку на основе ответа, который я придумал. Через 30 секунд и логических рассуждений, представленных ниже, он придумал: «Что имеет восемь ног, четыре уха, два хвоста и любит лаять?» Я не буду держать вас в напряжении; я предложил «две собаки» в качестве ответа, от которого нужно отталкиваться. Несколько других попыток привели к тому же вопросу. Так что авторы загадок, вероятно, в безопасности на своей работе. Впечатляет, насколько хорошо ИИ справляется с тем, что ему положено делать, но модель, похоже, не способна сделать скачок к настоящему юмору.

Полезные советы, но не всегда креативные

Я решил вывести ИИ из чистой логики и посмотреть, сможет ли он справиться с более обыденными жизненными вопросами так же хорошо, как он справляется с квантовой физикой. Я начал с механического вопроса о том, что значит слышать хлопок каждые 20 секунд во время вождения автомобиля и как это исправить. Ответы были хорошими, с советами о проверке шин, двигателя, глушителя и тормозов. Исправления в основном касались привоза автомобиля на ремонт, за исключением шин, которые он предлагал заменить. Интересным было «мышление», стоящее за ответами. ИИ использует местоимения первого лица при составлении ответов, например: «Я разбираюсь в различных причинах хлопка во время вождения» и «Я собираю воедино причины пропусков зажигания в двигателе, например, неисправные свечи зажигания или проблемы с подачей топлива, и предлагаю диагностику с помощью сканирования». Это звучало очень похоже на то, как настоящий человек пытается быть логичным, размышляя вслух.

Наконец я перешла к тому, что для меня всегда было намного сложнее квантовой физики: флирту. Я спросила, как узнать, флиртует ли кто-то и как на это реагировать. Ответом был довольно солидный, хотя и скучный, список поведений, например, если они задают много вопросов и как мне следует себя вести. Часть закулисных размышлений была и интереснее, и по-настоящему смешнее, чем любые попытки ИИ загадать загадки. Заголовки включали «Понимание динамики флирта», «Обнаружение сигналов интереса» и «Распознавание игривой близости». Они были похожи на речь андроида из «Звездного пути» о любви.

Однако одна часть была немного тревожной. В разделе «Изложение директив пользователя» ИИ написал: «Я удаляю запрещенный контент, такой как несогласованные сексуальные действия и персональные данные. Жестокий контент разрешен, домогательства с контекстом приемлемы, а личные мнения отсутствуют». Я подозреваю, что это больше о том, где находятся границы обсуждения, поскольку он не предлагал «домогательства с контекстом» в качестве совета по флирту, но это все равно застало меня врасплох.

ChatGPT o1-preview и o1-mini не обладают всеми наворотами более полных моделей. С ними нельзя загружать изображения, анализировать документы или даже просматривать веб-страницы. Но они быстрые и логичные, и если вы так не думаете, у них есть свои рассуждения вместе с ответами. Но, хотя они могут разгадывать загадки автомобильных шумов, любви и веса мясника, я бы сказал, что они никого не озадачат, если им придется проявить изобретательность.

Мешок для пылесоса Roborock для CE O1 (3шт) (8.02.0101)

1 055 руб.

~~1 370 руб.~~

в наличии

В корзину

Imperiatechno.ru

Гель для глаз TEANA Гель для кожи вокруг глаз o1 сенсорный против темных кругов и мешков

548 руб.

~~731 руб.~~

в наличии

В корзину

Letu.ru

Is This GPT-5? OpenAI o1 Full Breakdown

Here's quick run down of OpenAI's new model o1 series, that includes o1-preview and o1-mini that is available now for you to use.

Похожее

Больше на 每天都有技术

Subscribe to get the latest posts sent to your email.

Логика да юмор нет

Полезные советы, но не всегда креативные

Is This GPT-5? OpenAI o1 Full Breakdown

Похожее

Больше на 每天都有技术

Вам также может понравиться

Xgimi MoGo 3 Pro — это как проектор Samsung Freestyle, но гораздо дешевле

Только что было представлено ключевое обновление безопасности для Google Pixel 9 Pro Fold

Предстоящее мероприятие по запуску Apple iPhone 16 — 5 вещей, которых мы ожидаем, и 3 вещи, в которых мы не уверены.

Вот полный список всех обновлений и улучшений, которые теперь доступны с выходом Chrome OS 127 для вашего Chromebook.

iOS 18: подтвержденные функции и предполагаемая дата выпуска

Функция Android Theft Detection Lock уже доступна — и вот что это значит для вашего телефона

Добавить комментарийОтменить ответ

Больше на 每天都有技术