Он также дает советы по отношениям и заполняет пробелы в сюжете фильмов.
Когда OpenAI выпустила на этой неделе нашумевшую модель Strawberry для ChatGPT, она хвасталась своими способностями в области сложной логики, такой как программирование, секвенирование генов и квантовая физика, в серии видеороликов. Я верю компании на слово, что модели, называемые o1-preview и o1-mini на ChatGPT, способны на то, что они заявляют. Взлом сложных уравнений и исследование геномов, похоже, не составит для нее труда.
Но, как гордый член клуба логики и загадок моей средней школы, я хотел узнать, как он справляется на моей территории, решая и составляя головоломки и загадки. И тогда я подумал, что мне следует попросить у сверхлогичного ИИ совета по другим, более повседневным вопросам. Может ли он дать дельный совет по отношениям, рассказать, что означает странный шум в машине, и, возможно, даже заполнить сюжетные дыры в фильмах?
Логика да юмор нет
Короткий ответ — да. Модели o1-preview и mini действительно хороши в решении простых и сложных загадок. Я поигрался с обеими, и единственное реальное различие заключалось в количестве дополнительных шагов и, следовательно, скорости mini. Но, хотя они могут быть медленнее, чем GPT-4o, они очень быстро решают эти загадки по сравнению с человеком. Примечательно, что вы можете увидеть, как он раскладывает ответы по разным шагам. Я протестировал его на нескольких моих любимых, включая один из Хоббита . Логика ИИ имела смысл, хотя иногда она была неграмматической, как, например, когда он объяснял взвешивание мясника Майка.
Хорошо, он может справиться с существующими загадками, но может ли он придумать новую? В качестве теста я попросил его придумать забавную загадку на основе ответа, который я придумал. Через 30 секунд и логических рассуждений, представленных ниже, он придумал: «Что имеет восемь ног, четыре уха, два хвоста и любит лаять?» Я не буду держать вас в напряжении; я предложил «две собаки» в качестве ответа, от которого нужно отталкиваться. Несколько других попыток привели к тому же вопросу. Так что авторы загадок, вероятно, в безопасности на своей работе. Впечатляет, насколько хорошо ИИ справляется с тем, что ему положено делать, но модель, похоже, не способна сделать скачок к настоящему юмору.
Полезные советы, но не всегда креативные
Я решил вывести ИИ из чистой логики и посмотреть, сможет ли он справиться с более обыденными жизненными вопросами так же хорошо, как он справляется с квантовой физикой. Я начал с механического вопроса о том, что значит слышать хлопок каждые 20 секунд во время вождения автомобиля и как это исправить. Ответы были хорошими, с советами о проверке шин, двигателя, глушителя и тормозов. Исправления в основном касались привоза автомобиля на ремонт, за исключением шин, которые он предлагал заменить. Интересным было «мышление», стоящее за ответами. ИИ использует местоимения первого лица при составлении ответов, например: «Я разбираюсь в различных причинах хлопка во время вождения» и «Я собираю воедино причины пропусков зажигания в двигателе, например, неисправные свечи зажигания или проблемы с подачей топлива, и предлагаю диагностику с помощью сканирования». Это звучало очень похоже на то, как настоящий человек пытается быть логичным, размышляя вслух.
Наконец я перешла к тому, что для меня всегда было намного сложнее квантовой физики: флирту. Я спросила, как узнать, флиртует ли кто-то и как на это реагировать. Ответом был довольно солидный, хотя и скучный, список поведений, например, если они задают много вопросов и как мне следует себя вести. Часть закулисных размышлений была и интереснее, и по-настоящему смешнее, чем любые попытки ИИ загадать загадки. Заголовки включали «Понимание динамики флирта», «Обнаружение сигналов интереса» и «Распознавание игривой близости». Они были похожи на речь андроида из «Звездного пути» о любви.
Однако одна часть была немного тревожной. В разделе «Изложение директив пользователя» ИИ написал: «Я удаляю запрещенный контент, такой как несогласованные сексуальные действия и персональные данные. Жестокий контент разрешен, домогательства с контекстом приемлемы, а личные мнения отсутствуют». Я подозреваю, что это больше о том, где находятся границы обсуждения, поскольку он не предлагал «домогательства с контекстом» в качестве совета по флирту, но это все равно застало меня врасплох.
ChatGPT o1-preview и o1-mini не обладают всеми наворотами более полных моделей. С ними нельзя загружать изображения, анализировать документы или даже просматривать веб-страницы. Но они быстрые и логичные, и если вы так не думаете, у них есть свои рассуждения вместе с ответами. Но, хотя они могут разгадывать загадки автомобильных шумов, любви и веса мясника, я бы сказал, что они никого не озадачат, если им придется проявить изобретательность.
Is This GPT-5? OpenAI o1 Full Breakdown
Here's quick run down of OpenAI's new model o1 series, that includes o1-preview and o1-mini that is available now for you to use.
Больше на 每天都有技术
Subscribe to get the latest posts sent to your email.