ChatGPT o1-preview может решать загадки быстрее меня, и я его за это ненавижу

Он также дает советы по отношениям и заполняет пробелы в сюжете фильмов.

ChatGPT o1-preview can solve riddles faster than me and I kind of hate it for it

Когда OpenAI выпустила на этой неделе нашумевшую модель Strawberry для ChatGPT, она хвасталась своими способностями в области сложной логики, такой как программирование, секвенирование генов и квантовая физика, в серии видеороликов. Я верю компании на слово, что модели, называемые o1-preview и o1-mini на ChatGPT, способны на то, что они заявляют. Взлом сложных уравнений и исследование геномов, похоже, не составит для нее труда.

Но, как гордый член клуба логики и загадок моей средней школы, я хотел узнать, как он справляется на моей территории, решая и составляя головоломки и загадки. И тогда я подумал, что мне следует попросить у сверхлогичного ИИ совета по другим, более повседневным вопросам. Может ли он дать дельный совет по отношениям, рассказать, что означает странный шум в машине, и, возможно, даже заполнить сюжетные дыры в фильмах?

ChatGPT o1-preview can solve riddles faster than me and I kind of hate it for it

ChatGPT o1-preview can solve riddles faster than me and I kind of hate it for it

Логика да юмор нет

Короткий ответ — да. Модели o1-preview и mini действительно хороши в решении простых и сложных загадок. Я поигрался с обеими, и единственное реальное различие заключалось в количестве дополнительных шагов и, следовательно, скорости mini. Но, хотя они могут быть медленнее, чем GPT-4o, они очень быстро решают эти загадки по сравнению с человеком. Примечательно, что вы можете увидеть, как он раскладывает ответы по разным шагам. Я протестировал его на нескольких моих любимых, включая один из Хоббита . Логика ИИ имела смысл, хотя иногда она была неграмматической, как, например, когда он объяснял взвешивание мясника Майка.

Хорошо, он может справиться с существующими загадками, но может ли он придумать новую? В качестве теста я попросил его придумать забавную загадку на основе ответа, который я придумал. Через 30 секунд и логических рассуждений, представленных ниже, он придумал: «Что имеет восемь ног, четыре уха, два хвоста и любит лаять?» Я не буду держать вас в напряжении; я предложил «две собаки» в качестве ответа, от которого нужно отталкиваться. Несколько других попыток привели к тому же вопросу. Так что авторы загадок, вероятно, в безопасности на своей работе. Впечатляет, насколько хорошо ИИ справляется с тем, что ему положено делать, но модель, похоже, не способна сделать скачок к настоящему юмору.

ChatGPT o1-preview can solve riddles faster than me and I kind of hate it for it

ChatGPT o1-preview can solve riddles faster than me and I kind of hate it for it

Полезные советы, но не всегда креативные

Я решил вывести ИИ из чистой логики и посмотреть, сможет ли он справиться с более обыденными жизненными вопросами так же хорошо, как он справляется с квантовой физикой. Я начал с механического вопроса о том, что значит слышать хлопок каждые 20 секунд во время вождения автомобиля и как это исправить. Ответы были хорошими, с советами о проверке шин, двигателя, глушителя и тормозов. Исправления в основном касались привоза автомобиля на ремонт, за исключением шин, которые он предлагал заменить. Интересным было «мышление», стоящее за ответами. ИИ использует местоимения первого лица при составлении ответов, например: «Я разбираюсь в различных причинах хлопка во время вождения» и «Я собираю воедино причины пропусков зажигания в двигателе, например, неисправные свечи зажигания или проблемы с подачей топлива, и предлагаю диагностику с помощью сканирования». Это звучало очень похоже на то, как настоящий человек пытается быть логичным, размышляя вслух.

Наконец я перешла к тому, что для меня всегда было намного сложнее квантовой физики: флирту. Я спросила, как узнать, флиртует ли кто-то и как на это реагировать. Ответом был довольно солидный, хотя и скучный, список поведений, например, если они задают много вопросов и как мне следует себя вести. Часть закулисных размышлений была и интереснее, и по-настоящему смешнее, чем любые попытки ИИ загадать загадки. Заголовки включали «Понимание динамики флирта», «Обнаружение сигналов интереса» и «Распознавание игривой близости». Они были похожи на речь андроида из «Звездного пути» о любви.

Однако одна часть была немного тревожной. В разделе «Изложение директив пользователя» ИИ написал: «Я удаляю запрещенный контент, такой как несогласованные сексуальные действия и персональные данные. Жестокий контент разрешен, домогательства с контекстом приемлемы, а личные мнения отсутствуют». Я подозреваю, что это больше о том, где находятся границы обсуждения, поскольку он не предлагал «домогательства с контекстом» в качестве совета по флирту, но это все равно застало меня врасплох.

ChatGPT o1-preview и o1-mini не обладают всеми наворотами более полных моделей. С ними нельзя загружать изображения, анализировать документы или даже просматривать веб-страницы. Но они быстрые и логичные, и если вы так не думаете, у них есть свои рассуждения вместе с ответами. Но, хотя они могут разгадывать загадки автомобильных шумов, любви и веса мясника, я бы сказал, что они никого не озадачат, если им придется проявить изобретательность.

Is This GPT-5? OpenAI o1 Full Breakdown

Here's quick run down of OpenAI's new model o1 series, that includes o1-preview and o1-mini that is available now for you to use.


Больше на 每天都有技术

Subscribe to get the latest posts sent to your email.

Добавить комментарий

Больше на 每天都有技术

Оформите подписку, чтобы продолжить чтение и получить доступ к полному архиву.

Читать дальше