[00:00] Сегодня я пообщаюсь с Питером Штайнбергером, создателем OpenCloud, персонального ИИ-агента с открытым кодом, который просто взорвал интернет. Репозиторий на GitHub взлетел до 160 тысяч звезд практически за одну ночь. Сообщество создало массу проектов, вроде Молдбук, где боты общаются между собой. И теперь боты даже нанимают людей для выполнения задач в реальном мире. В нашей беседе мы обсудим, как его озарило созданием такого ИИ-агента, его нестандартные принципы разработки и то, что все это значит для создателей 
[00:32] в 26-м году. Рад тебя видеть, дружище. Привет, как дела? Похоже ты сделал то, что нужно людям. Кажется да. OpenCloud, как он теперь называется, абсолютно... это уже пятое название, да? Он просто взорвал интернет. Как прошли эти последние пару недель? Боже мой. Мне нужна... нужна пещера и неделя одиночества. 
[01:04] Ты только что вышел из пещеры и уже хочешь обратно, как маленький лобстер. Это безумие. Не знаю, как один человек может это все переварить. Мне, наверное, нужна еще неделя, только чтобы ответить на все письма. Были и невероятно крутые вещи, и ужасные, но очевидно, я создал то, что вызвало эмоции, заинтересовало и вдохновило людей, это очень здорово. Многие работали над ИИ и персональными ассистентами. Как думаешь, почему именно OpenCloud так выстрелил? 
[01:37] Думаю, главное отличие в том, что он работает прямо на твоем компьютере. Все, что я видел до этого, работало в облаке. Облачный ИИ умеет делать несколько прикольных штук, но если запустить его локально, он может абсолютно все, понимаешь? И это куда мощнее. Да, машина может делать все, что ты сам можешь делать с ее помощью. Он может подключиться к духовке, к Тесле, к свету, к Сонос, к моей кровати. Он может менять температуру моей постели. Чаджи Пити на такое не способен. 
[02:09] Ты даешь ему все свои навыки. Друг рассказывал. Он установил OpenCloud, и тот предложил изучить файлы в компьютере и составить рассказ о прошедшем годе. Получилась потрясающая история, и он такой, как ты это сделал? А OpenCloud нашел аудиозаписи, друг каждое воскресенье что-то записывал. Он сам об этом забыл, ведь это было больше года назад, просто имея доступ ко всему компьютеру, ИИ может тебя 
[02:39] удивить. Ты ведь даешь ему все данные, так что он может удивлять тебя по-разному. И вот теперь мы переходим от взаимодействия человека с ботом, о котором ты говорил, к общению ботов между собой, или даже ботов с людьми, когда они от твоего имени нанимают кого-то для задач в реальном мире. Что вообще происходит? 
[03:12] Думаю, это естественный следующий шаг. Допустим, я хочу забронировать столик. Мой бот свяжется с ботом ресторана и проведет переговоры, потому что так эффективнее. Или, может это старый ресторан, и моему боту придется привлечь человека, чтобы тот позвонил туда, потому что они не любят ботов, или сходил бы туда постоять в очереди, если владелец не найдет для этого робота. Я представляю, что у меня может быть даже несколько 
[03:45] ботов, своего рода специалисты, один для личной жизни, другой для рабочих дел, может один будет отвечать за наши отношения. Не знаю, мы в самом начале пути. Столько всего еще предстоит понять, выяснить, как это на самом деле. Но я чувствую, что процесс уже запущен. Похоже, все гнались за неким централизованным сверхразумом, а за последние 10 дней появилось нечто 
[04:15] вроде ролевого интеллекта и интеллекта сообщества. Думаю, если посмотреть на одного человека, чего он может достичь сам по себе? Смог бы один человек создать айфон? Или в одиночку полететь в космос? Один человек, скорее всего, даже еду бы не смог себе найти. Но в группе мы специализируемся, в масштабах общества эта специализация еще глубже. 
[04:45] Чему мы можем поучиться у этого опыта, чтобы применить в ИИ? У нас уже есть ИИ, который специализируется на определенных вещах, хотя это и общий интеллект, что если он одновременно будет и специализированным? Уверен, это будет очень захватывающе. Да, ты словно открыл окно в будущее, и теперь куча людей что-то на этом строит, и у них случается свой момент озарения. Можешь вспомнить, когда у тебя случился этот момент озарения, и описать его? 
[05:16] Мне хотелось чего-то простого. Вводишь текст и компьютер выполняет задачу. Совсем просто. В мае или июне я собрал одну версию. Было круто, но не совсем то. Потом я наворотил кучу всего другого, и собрал целую армию, и в ноябре настал день, когда мне снова это понадобилось. Я ушел на кухню, и просто хотел проверить, продолжают 
[05:47] ли мой компьютер выполнять задачи, или закончил ли он их. Своими задачами было программирование? Да, конечно. Ты кодил что-то другое? Или саму эту штуку? Нет, нет, просто снова возникла потребность, и я такой.. Что ты тогда кодил? Что создавал? Боже, если заглянуть в мой гитхаб, там проектов сорок. Я уже и не помню. Это была штука под названием Саморайз. Небольшое консольное приложение. Даешь ему что угодно, подкаст или вот такое интервью, 
[06:20] и оно делает краткий пересказ слайдами прямо в терминале. Теперь это возможно. Так что из любви к компьютерам, ты начал возиться с разными штуками, ты ведь фактически вернулся из отставки чтобы заняться ИИ, и постепенно так втянулся, что захотел делать это постоянно, даже на ходу с телефона. Мой последний проект.. Я два месяца работал над Вайп Таннел, и дошло до того, что я кодил даже в гостях у друзей. 
[06:51] Я понял, надо завязывать, это вызывает слишком сильное привыкание. А в ноябре потребность вернулась, и я начал делать Кладпот, который теперь называется Опен Клоу. С самого начала я понимал, что переделываю все заново, но на этот раз гораздо лучше. Теперь не нужно печатать в терминале, ты просто общаешься как с другом. Не думаешь о сжатии, новых сессиях, о том в какой ты папке, или какую модель используешь. Я оставил возможности для продвинутых пользователей, 
[07:23] но обычно ты просто говоришь с другом. Это некая сущность или призрачный помощник, который управляет твоей мышью, клавиатурой, и просто делает все сам. И когда наступил тот момент озарения, когда ты понял «Ого, эта штука умеет гораздо больше, чем я предполагал!» Буквально через час после создания первого очень корявого прототипа, это была просто склейка между Ватсап и Кладкод, я вызывал Кладкод и получал от него 
[07:57] строку. Работало медленно, но работало. Но мне хотелось картинок, чтобы модель могла присылать изображения или создавать их для меня. На это ушло еще несколько часов. Потом я поехал в Марракеш на день рождения. Интернет там был так себе, но Ватсап работает везде, там же просто текст. Я часто пользовался им в ресторанах, делал фото и просил перевести. Это было безумно полезно, и приятно, потому что он 
[08:30] общался на моем языке, с юмором, немного дерзко. И вот я иду, и отправляю ему голосовое сообщение. И тут до меня доходит, стоп, это не сработает, я же этого не настраивал. Индикатор набора текста мигал секунд 10, и вдруг приходит ответ. Я в шоке, как ты, черт возьми, это сделал? И он отвечает, я сделал вот что, ты отправил мне сообщение, я увидел файл без расширения, заглянул в заголовок и 
[09:01] понял, что это формат Opus, с помощью FFmpeg сконвертировал его в Wave, потом хотел расшифровать, но локальный уиспер не был установлен. Тогда он поискал в системе, нашел мой ключ OpenAI, и через Керл отправил запрос, получил текст и ответил мне. И все это, секунд за 9. При том что ты этого не встраивал, и не ожидал. Модели для кодинга стали настолько хороши, что их навык творческого решения задач отлично переносится в реальный мир. 
[09:32] Есть огромная корреляция. Это абстрактный навык. Умение решать проблемы, применимо не только к коду, но и к любой жизненной задаче. Модель увидела, о, странный магический файл, не знаю что это, надо разобраться, и сделала все возможное. Она даже сообразила не устанавливать виспер локально, потому что знала, скачивание модели займет несколько минут. А я человек нетерпеливый, она выбрала самый разумный 
[10:08] путь. В тот момент я просто офигел. Вот тут я понял, что это вещь. Подпишись прямо сейчас на мой телеграм-канал по ссылке в описании. Я подготовил для тебя ТОП-3 материала, которые на мой взгляд должен знать каждый. Первое. Карта сотни топовых AI-стартапов – это будущее на одной картинке. Второе. Прогноз от инсайдера из OpenAI, который еще до появления ChatGPT предсказал все, что сейчас происходит с нейронками, 
[10:40] и вот в этом году он выпустил новый прогноз до 2027 года. И третье, самое мощное, это мой разбор эссе основателя компании Antropic, который по сути второй человек в мире искусственного интеллекта. Он по полочкам разложил, что будет происходить в мире ближайшие пять лет, и главное, каким будет универсальный AI, которого все так боятся или ждут. Переходи по ссылке в описании. Если компьютеры могут делать все то, чего ты даже не ожидал, и тебе не нужно создавать под какую-то задачу отдельное 
[11:10] приложение, неужели приложения просто исчезнут? Думаю 80% из них исчезнут. Зачем мне нужен MyFitnessPal? Мой агент и так знает, когда я принимаю нервные решения. Я в какой-нибудь бургерной и он понимает, что я ем то, что люблю. Если я не оставлю комментарий, он просто сам все учтет, или я сделаю фото и он его сохранит. Мне даже не нужно об этом заботиться. А потом он возможно подкорректирует мой график тренировок, 
[11:42] добавит немного кардио. Мне не нужно фитнес-приложение, потому что он сам планирует все за меня. Зачем мне список дел? Я просто говорю, напомни мне об этом и об этом, и на следующий день он напоминает. Важно ли мне где это хранится? Нет, он просто делает свое дело. Любое приложение, которое по сути просто управляет данными, агенты смогут заменить более эффективным и естественным способом. Выживут пожалуй только те приложения, которым нужны датчики. И если в таком сценарии большинство приложений 
[12:14] исчезнет, останутся ли модели единственным подобием приложений? Не все исчезнет. Но да, я думаю, что у крупных компаний-разработчиков-моделей есть серьезное преимущество, ведь в конечном счете именно они выдают токены. Оказалась одна из жалоб, это слишком большой расход токенов. Вам просто очень нравится их использовать, поэтому вы ими и пользуетесь так часто, сжигая токены. Разве я виноват, что создал нечто настолько популярное? 
[12:47] Все эти модели постоянно обгоняют друг друга, и возможно они становятся массовым товаром. Если приложения исчезнут, а модели станут общедоступными, что-то типа когда мозг лобстера можно легко заменить, что тогда останется? В чем будет ценность? В накопленной памяти, сложности системы? Что остается? Во-первых, я не думаю, что у разработчиков-моделей всегда будет это преимущество. 
[13:19] Вы и сами это видите. Выходит новая модель, все в восторге, боже, как это круто, а через месяц она якобы портится и становится никуда не годной, мол ее урезали, но нет, они ничего не делали, просто вы привыкли к новому стандарту, и ваши ожидания выросли, а модель остается на прежнем уровне. Какое-то время вы ее любите, а затем она становится стандартом, и на то, что было раньше, уже и смотреть не хочется. У нас есть опенсорс-решение уровня топовых моделей 
[13:51] годичной давности, все их хейтят, жалуются, что они плохие и скучные, но ведь это именно то, что мы имели тогда. Через год нынешние технологии станут открытыми, и мы будем ими недовольны, потому что привыкнем к лучшему. Так что в образимом будущем у гигантов все еще есть фора. И с точки зрения контроля это будет интересно. Сейчас у каждой компании свой закрытый бункер данных. Не думаю, что есть способ, ну может только для европейцев, вытащить свои воспоминания из чат GPT. 
[14:23] По крайней мере я о таком не знаю. И уж точно нет способа передать их другой компании. Если бы я был сервисом чатов, ты мог бы пользоваться мной. Но доступа к тем воспоминаниям у меня бы не было. Компании пытаются привязать тебя к своему хранилищу, а прелесть OpenCloud в том, что он как бы вцепляется в данные чрезконечного пользователя. В итоге ведь именно у пользователя есть доступ, иначе бы ничего не работало. А раз у пользователя есть доступ, значит и я могу 
[14:55] до них добраться. И воспоминания принадлежат тебе. Это просто кучка маркдаун-файлов на твоем компе. Не я ими владею. Да, каждый сам владеет своими воспоминаниями в виде набора файлов на своем железе. И честно говоря, это очень личные вещи. Ведь люди используют агентов не только для решения задач, но и для обсуждения личных проблем. Причем очень быстро к этому приходят. Я и сам так делаю. Там есть такие воспоминания, утечки которых я бы точно не хотел. 
[15:26] Чтобы ты скорее побоялся показать историю поиска в гугл, или свои файлы мемори.мд? Что такое гугл? Им еще кто-то пользуется? В общем, когда я это создал, я был в восторге, но в Твиттере люди не понимали. У меня не получалось объяснить, в чем крутизна. Это нужно прочувствовать. Я пробовал по-разному, но так и не смог нормально 
[15:57] донести суть. И тогда решил, сделаю-ка я что-нибудь безумное. Я создал сервер в Дискорд, и выложил своего бота в общий доступ безо всяких ограничений безопасности. Люди заходили, общались с ним, видели, как я пишу софт прямо через него, пытались взломать его промпт-инъекциями, а мой агент просто смеялся над ними. Ты же ограничил его своим ID, чтобы он слушался только тебя? Да, да, именно. Плюс прописал очень четкие инструкции, что остальные 
[16:27] опасны, и слушать надо только меня. Но отвечать он должен всем. И где хранились эти инструкции? Это важная часть самого Опен Клоу. Это часть системного промпта. Он объясняет, ты в Дискорде, там есть посторонние люди, но слушаешься ты только своего владельца. Не знаю даже как я это сформулировал. Твоего бога. Я строил систему очень органично, какой-то момент 
[17:00] я создал файлы identity.md, личность, soul.md, душа, и другие, и только в январе начал делать так, чтобы другим было проще это устанавливать. Я помню как создавал шаблоны, посмотри что у меня есть, и сделай шаблоны, и кодекс их написал, и получилось что-то вроде хлеб, ну знаешь, шутят что кодекс на вкус как пресный хлеб, у них сейчас появился новый дружелюбный голос, я его еще не пробовал, но те новые 
[17:32] боты казались такими скучными по сравнению с тем что было у меня. И я сказал, Мальти, вдохни жизнь, Мальти это имя твоего персонального.. да, это новое имя, со старым возникли некоторые юридические сложности. То есть ты разговаривал с Мальти? Да, я сказал ему, наполни эти шаблоны своим характером, и он их переписал. Все что получилось в итоге, было реально забавным. Боты не настолько смешные, как мои оригиналы, поэтому кое-что я оставил в секрете. 
[18:02] Единственный файл, который я не выложил в открытый доступ, это Sol.md, душа. И хотя мой бот висит в публичном дискорде, этот файл пока не вскрыли. Расскажи подробнее про Sol.md. Я видел исследование от Антропик, кажется, оно уже в открытом доступе, но пару месяцев назад было секретным. Там кто-то случайно обнаружил текст, скрытый в весах модели. Она не помнила, что учила его, но он был вшит в ее основу как некая конституция. 
[18:33] Меня это дико заворожило. Мы обсудили это с моим агентом, и создали Sol.md, с базовыми ценностями, как мы видим взаимодействие человека и ИИ, что важно мне, что важно модели. Местами там, конечно, какая-то эзотерика и бессмыслица, но есть и реально ценные вещи, благодаря которым модель реагирует на текст, очень естественно. В вопросах разработки OpenCLO, ты тоже порой идешь против течения. 
[19:04] Твой выбор моделей для кодинга, то, над чем ты запускаешь бота, и сам процесс написания кода. Сейчас популярны Git-ворктрис, все больше инструментов их поддерживают, но ты говоришь, никаких ворктрис, просто несколько копий репозитория в разных папках и куча окон терминала. Скажи про свой подход. Да, мне кажется, сейчас весь мир помешан на Клод Код. А я обожаю кодекс, потому что он просматривает гораздо больше файлов, прежде чем решить, что именно изменить. 
[19:39] Тебе не нужно устраивать танцы с бубном, чтобы получить нормальный результат. Если ты опытный водитель, то выжмешь максимум из любого инструмента. Но кодекс он просто... он просто великолепен. Он невероятно медленный, поэтому я иногда запускаю по 10 штук одновременно, штук 6, на одном экране, по паре на других. Это и так создает приличную когнитивную нагрузку, приходится постоянно переключаться, поэтому я стараюсь минимизировать 
[20:11] сложность во всем остальном. В моей голове ветка Мэйн всегда должна быть готова к отправке. У меня просто несколько копий одного и того же репозитория, и все на ветке Мэйн. Мне не нужно думать, как назвать ветку, не нужно бояться конфликтов имен. В WorkTrees есть свои ограничения, о которых мне не нужно париться, если это просто копии папок. И я не люблю графические интерфейсы. Это опять же, лишняя сложность. 
[20:42] Чем меньше трения и препятствий, тем лучше. Все, что меня волнует, это синхронизация и текст. Мне не обязательно видеть весь код целиком. Обычно он просто проносится перед глазами. Иногда попадаются действительно заковыристые куски, которые я хочу изучить лично. Но в большинстве случаев, если ты четко понимаешь архитектуру, синхронизируешь ее и обсуждаешь с агентом, все в порядке. А еще я очень рад, что даже не стал встраивать поддержку MCP. OpenCloud очень успешен, и в нем нет нативной поддержки 
[21:13] MCP. С небольшой оговоркой. Я создал навык, использующий МакПортер. Это один из моих инструментов, который превращает MCP в обычные CLI утилиты, интерфейс командной строки. Так что можно использовать любой MCP как CLI. Но я полностью пропустил всю эту классическую чехарду с протоколами. Благодаря этому, тебе не нужно перезагружаться, в отличие от того же Керсер или Клоудев, где приходится перезапускать все приложение. Это гораздо элегантнее и лучше масштабируется. 
[21:44] Посмотрите на Антропик. Они создали инструмент поиска, что-то очень специфическое под MCP, что долго было в бете, потому что это жутко сложно. А у меня просто CLI. Бот отлично шарит в Юникс. У тебя может быть сколько угодно таких утилит, и все просто работает. Я очень доволен, что жалоб на отсутствие MCP почти нет. Получается, ты просто даешь ему те инструменты, которыми любят пользоваться люди. Именно. 
[22:15] И не изобретаешь велосипед специально для ботов. Ни один человек в здравом уме не станет вызывать MCP вручную. Да, все просто хотят использовать командную строку. За этим будущее. Я только за. Спасибо большое, что нашел время прийти и поболтать. Это было очень вдохновляюще. Когда мы переписывались последние пару лет, и я видел, как ты возвращаешься в игру, Питер, то, что ты сделал, этот странный вайп-таннел и прочее, на что никто не обращал внимания, ты буквально гнался за своей мечтой, 
[22:45] и я просто в восторге от того, что происходит сейчас. Конечно, это должен был быть кто-то вроде одиночки из какой-то крошечной страны, далекой от Кремниевого острова, чтобы принести все это нам. Ты огромное вдохновение. Спасибо, Питер. Редактор субтитров А.Семкин Корректор А.Егорова