1 00:00:00,000 --> 00:00:03,319 Сегодня я пообщаюсь с Питером Штайнбергером, создателем 2 00:00:03,319 --> 00:00:07,000 OpenCloud, персонального ИИ-агента с открытым кодом, который 3 00:00:07,000 --> 00:00:08,279 просто взорвал интернет. 4 00:00:08,279 --> 00:00:12,680 Репозиторий на GitHub взлетел до 160 тысяч звезд практически 5 00:00:12,680 --> 00:00:13,680 за одну ночь. 6 00:00:13,680 --> 00:00:16,879 Сообщество создало массу проектов, вроде Молдбук, 7 00:00:16,879 --> 00:00:19,159 где боты общаются между собой. 8 00:00:19,159 --> 00:00:22,299 И теперь боты даже нанимают людей для выполнения задач 9 00:00:22,299 --> 00:00:23,299 в реальном мире. 10 00:00:23,299 --> 00:00:26,540 В нашей беседе мы обсудим, как его озарило созданием 11 00:00:26,540 --> 00:00:29,639 такого ИИ-агента, его нестандартные принципы 12 00:00:29,639 --> 00:00:32,240 разработки и то, что все это значит для создателей 13 00:00:32,240 --> 00:00:39,240 в 26-м году. 14 00:00:39,240 --> 00:00:40,639 Рад тебя видеть, дружище. 15 00:00:40,639 --> 00:00:42,319 Привет, как дела? 16 00:00:42,319 --> 00:00:44,560 Похоже ты сделал то, что нужно людям. 17 00:00:44,560 --> 00:00:45,560 Кажется да. 18 00:00:45,560 --> 00:00:49,759 OpenCloud, как он теперь называется, абсолютно... это уже пятое 19 00:00:49,759 --> 00:00:51,279 название, да? 20 00:00:51,279 --> 00:00:54,360 Он просто взорвал интернет. 21 00:00:54,360 --> 00:00:57,159 Как прошли эти последние пару недель? 22 00:00:57,159 --> 00:00:59,400 Боже мой. 23 00:01:00,159 --> 00:01:04,160 Мне нужна... нужна пещера и неделя одиночества. 24 00:01:04,160 --> 00:01:06,959 Ты только что вышел из пещеры и уже хочешь обратно, как 25 00:01:06,959 --> 00:01:08,319 маленький лобстер. 26 00:01:08,319 --> 00:01:09,639 Это безумие. 27 00:01:09,639 --> 00:01:12,879 Не знаю, как один человек может это все переварить. 28 00:01:12,879 --> 00:01:15,800 Мне, наверное, нужна еще неделя, только чтобы ответить 29 00:01:15,800 --> 00:01:17,160 на все письма. 30 00:01:17,160 --> 00:01:23,000 Были и невероятно крутые вещи, и ужасные, но очевидно, 31 00:01:23,000 --> 00:01:27,080 я создал то, что вызвало эмоции, заинтересовало 32 00:01:27,080 --> 00:01:29,360 и вдохновило людей, это очень здорово. 33 00:01:30,319 --> 00:01:32,599 Многие работали над ИИ и персональными ассистентами. 34 00:01:32,599 --> 00:01:37,480 Как думаешь, почему именно OpenCloud так выстрелил? 35 00:01:37,480 --> 00:01:40,239 Думаю, главное отличие в том, что он работает прямо 36 00:01:40,239 --> 00:01:41,480 на твоем компьютере. 37 00:01:41,480 --> 00:01:45,519 Все, что я видел до этого, работало в облаке. 38 00:01:45,519 --> 00:01:48,480 Облачный ИИ умеет делать несколько прикольных штук, 39 00:01:48,480 --> 00:01:52,559 но если запустить его локально, он может абсолютно все, 40 00:01:52,559 --> 00:01:53,559 понимаешь? 41 00:01:53,559 --> 00:01:54,559 И это куда мощнее. 42 00:01:54,559 --> 00:01:56,879 Да, машина может делать все, что ты сам можешь делать 43 00:01:56,879 --> 00:01:57,879 с ее помощью. 44 00:01:57,879 --> 00:02:02,839 Он может подключиться к духовке, к Тесле, к свету, 45 00:02:02,839 --> 00:02:04,800 к Сонос, к моей кровати. 46 00:02:04,800 --> 00:02:07,279 Он может менять температуру моей постели. 47 00:02:07,279 --> 00:02:09,240 Чаджи Пити на такое не способен. 48 00:02:09,240 --> 00:02:11,119 Ты даешь ему все свои навыки. 49 00:02:11,119 --> 00:02:12,679 Друг рассказывал. 50 00:02:12,679 --> 00:02:18,600 Он установил OpenCloud, и тот предложил изучить файлы 51 00:02:18,600 --> 00:02:21,919 в компьютере и составить рассказ о прошедшем годе. 52 00:02:21,919 --> 00:02:25,000 Получилась потрясающая история, и он такой, как 53 00:02:25,000 --> 00:02:26,000 ты это сделал? 54 00:02:26,119 --> 00:02:31,600 А OpenCloud нашел аудиозаписи, друг каждое воскресенье 55 00:02:31,600 --> 00:02:32,600 что-то записывал. 56 00:02:32,600 --> 00:02:36,559 Он сам об этом забыл, ведь это было больше года назад, 57 00:02:36,559 --> 00:02:39,679 просто имея доступ ко всему компьютеру, ИИ может тебя 58 00:02:39,679 --> 00:02:40,679 удивить. 59 00:02:40,679 --> 00:02:51,399 Ты ведь даешь ему все данные, так что он может удивлять 60 00:02:51,399 --> 00:02:52,399 тебя по-разному. 61 00:02:52,399 --> 00:02:55,600 И вот теперь мы переходим от взаимодействия человека 62 00:02:56,199 --> 00:03:00,919 с ботом, о котором ты говорил, к общению ботов между собой, 63 00:03:00,919 --> 00:03:05,679 или даже ботов с людьми, когда они от твоего имени 64 00:03:05,679 --> 00:03:09,119 нанимают кого-то для задач в реальном мире. 65 00:03:09,119 --> 00:03:12,600 Что вообще происходит? 66 00:03:12,600 --> 00:03:16,320 Думаю, это естественный следующий шаг. 67 00:03:16,320 --> 00:03:18,960 Допустим, я хочу забронировать столик. 68 00:03:18,960 --> 00:03:24,839 Мой бот свяжется с ботом ресторана и проведет переговоры, 69 00:03:25,080 --> 00:03:26,080 потому что так эффективнее. 70 00:03:26,080 --> 00:03:30,160 Или, может это старый ресторан, и моему боту придется привлечь 71 00:03:30,160 --> 00:03:33,240 человека, чтобы тот позвонил туда, потому что они не любят 72 00:03:33,240 --> 00:03:39,279 ботов, или сходил бы туда постоять в очереди, если 73 00:03:39,279 --> 00:03:40,919 владелец не найдет для этого робота. 74 00:03:40,919 --> 00:03:45,479 Я представляю, что у меня может быть даже несколько 75 00:03:45,479 --> 00:03:50,479 ботов, своего рода специалисты, один для личной жизни, другой 76 00:03:50,479 --> 00:03:54,320 для рабочих дел, может один будет отвечать за наши 77 00:03:54,320 --> 00:03:55,320 отношения. 78 00:03:55,320 --> 00:04:00,080 Не знаю, мы в самом начале пути. 79 00:04:00,080 --> 00:04:03,320 Столько всего еще предстоит понять, выяснить, как это 80 00:04:03,320 --> 00:04:04,320 на самом деле. 81 00:04:04,320 --> 00:04:08,240 Но я чувствую, что процесс уже запущен. 82 00:04:08,240 --> 00:04:10,399 Похоже, все гнались за неким централизованным 83 00:04:10,399 --> 00:04:15,559 сверхразумом, а за последние 10 дней появилось нечто 84 00:04:15,559 --> 00:04:18,399 вроде ролевого интеллекта и интеллекта сообщества. 85 00:04:18,399 --> 00:04:23,320 Думаю, если посмотреть на одного человека, чего 86 00:04:23,320 --> 00:04:27,399 он может достичь сам по себе? 87 00:04:27,399 --> 00:04:29,640 Смог бы один человек создать айфон? 88 00:04:29,640 --> 00:04:32,519 Или в одиночку полететь в космос? 89 00:04:32,519 --> 00:04:34,880 Один человек, скорее всего, даже еду бы не смог себе 90 00:04:34,880 --> 00:04:35,880 найти. 91 00:04:35,880 --> 00:04:43,519 Но в группе мы специализируемся, в масштабах общества эта 92 00:04:43,519 --> 00:04:45,920 специализация еще глубже. 93 00:04:45,920 --> 00:04:48,799 Чему мы можем поучиться у этого опыта, чтобы применить 94 00:04:48,799 --> 00:04:49,799 в ИИ? 95 00:04:49,799 --> 00:04:53,299 У нас уже есть ИИ, который специализируется на определенных 96 00:04:54,279 --> 00:04:58,220 вещах, хотя это и общий интеллект, что если он одновременно 97 00:04:58,220 --> 00:05:02,179 будет и специализированным? 98 00:05:02,179 --> 00:05:04,820 Уверен, это будет очень захватывающе. 99 00:05:04,820 --> 00:05:07,779 Да, ты словно открыл окно в будущее, и теперь куча 100 00:05:07,779 --> 00:05:10,940 людей что-то на этом строит, и у них случается свой момент 101 00:05:10,940 --> 00:05:11,940 озарения. 102 00:05:11,940 --> 00:05:14,660 Можешь вспомнить, когда у тебя случился этот момент 103 00:05:14,660 --> 00:05:16,980 озарения, и описать его? 104 00:05:16,980 --> 00:05:18,859 Мне хотелось чего-то простого. 105 00:05:18,859 --> 00:05:21,660 Вводишь текст и компьютер выполняет задачу. 106 00:05:21,660 --> 00:05:22,660 Совсем просто. 107 00:05:22,660 --> 00:05:28,459 В мае или июне я собрал одну версию. 108 00:05:28,459 --> 00:05:32,220 Было круто, но не совсем то. 109 00:05:32,220 --> 00:05:35,739 Потом я наворотил кучу всего другого, и собрал 110 00:05:35,739 --> 00:05:41,660 целую армию, и в ноябре настал день, когда мне снова 111 00:05:41,660 --> 00:05:42,660 это понадобилось. 112 00:05:42,660 --> 00:05:47,100 Я ушел на кухню, и просто хотел проверить, продолжают 113 00:05:47,100 --> 00:05:49,820 ли мой компьютер выполнять задачи, или закончил ли 114 00:05:49,820 --> 00:05:50,820 он их. 115 00:05:50,980 --> 00:05:52,779 Своими задачами было программирование? 116 00:05:52,779 --> 00:05:53,779 Да, конечно. 117 00:05:53,779 --> 00:05:55,660 Ты кодил что-то другое? 118 00:05:55,660 --> 00:05:57,220 Или саму эту штуку? 119 00:05:57,220 --> 00:06:01,660 Нет, нет, просто снова возникла потребность, и я такой.. 120 00:06:01,660 --> 00:06:03,339 Что ты тогда кодил? 121 00:06:03,339 --> 00:06:04,339 Что создавал? 122 00:06:04,339 --> 00:06:07,299 Боже, если заглянуть в мой гитхаб, там проектов 123 00:06:07,299 --> 00:06:08,299 сорок. 124 00:06:08,299 --> 00:06:09,299 Я уже и не помню. 125 00:06:09,299 --> 00:06:13,459 Это была штука под названием Саморайз. 126 00:06:13,459 --> 00:06:16,500 Небольшое консольное приложение. 127 00:06:16,500 --> 00:06:20,059 Даешь ему что угодно, подкаст или вот такое интервью, 128 00:06:20,299 --> 00:06:24,019 и оно делает краткий пересказ слайдами прямо в терминале. 129 00:06:24,019 --> 00:06:26,540 Теперь это возможно. 130 00:06:26,540 --> 00:06:29,459 Так что из любви к компьютерам, ты начал возиться с разными 131 00:06:29,459 --> 00:06:32,619 штуками, ты ведь фактически вернулся из отставки чтобы 132 00:06:32,619 --> 00:06:37,359 заняться ИИ, и постепенно так втянулся, что захотел 133 00:06:37,359 --> 00:06:40,500 делать это постоянно, даже на ходу с телефона. 134 00:06:40,500 --> 00:06:42,140 Мой последний проект.. 135 00:06:42,140 --> 00:06:46,859 Я два месяца работал над Вайп Таннел, и дошло до 136 00:06:46,859 --> 00:06:51,179 того, что я кодил даже в гостях у друзей. 137 00:06:51,179 --> 00:06:54,540 Я понял, надо завязывать, это вызывает слишком сильное 138 00:06:54,540 --> 00:06:55,540 привыкание. 139 00:06:55,540 --> 00:06:58,980 А в ноябре потребность вернулась, и я начал делать 140 00:06:58,980 --> 00:07:02,179 Кладпот, который теперь называется Опен Клоу. 141 00:07:02,179 --> 00:07:06,739 С самого начала я понимал, что переделываю все заново, 142 00:07:06,739 --> 00:07:08,899 но на этот раз гораздо лучше. 143 00:07:08,899 --> 00:07:11,899 Теперь не нужно печатать в терминале, ты просто общаешься 144 00:07:11,899 --> 00:07:12,899 как с другом. 145 00:07:12,899 --> 00:07:16,619 Не думаешь о сжатии, новых сессиях, о том в какой ты 146 00:07:17,380 --> 00:07:18,899 папке, или какую модель используешь. 147 00:07:18,899 --> 00:07:23,420 Я оставил возможности для продвинутых пользователей, 148 00:07:23,420 --> 00:07:26,420 но обычно ты просто говоришь с другом. 149 00:07:26,420 --> 00:07:30,299 Это некая сущность или призрачный помощник, который 150 00:07:30,299 --> 00:07:33,140 управляет твоей мышью, клавиатурой, и просто делает 151 00:07:33,140 --> 00:07:34,140 все сам. 152 00:07:34,140 --> 00:07:37,140 И когда наступил тот момент озарения, когда ты понял 153 00:07:37,140 --> 00:07:41,859 «Ого, эта штука умеет гораздо больше, чем я предполагал!» 154 00:07:41,859 --> 00:07:46,260 Буквально через час после создания первого очень 155 00:07:46,260 --> 00:07:49,820 корявого прототипа, это была просто склейка между 156 00:07:49,820 --> 00:07:57,420 Ватсап и Кладкод, я вызывал Кладкод и получал от него 157 00:07:57,420 --> 00:07:58,420 строку. 158 00:07:58,420 --> 00:08:01,420 Работало медленно, но работало. 159 00:08:01,420 --> 00:08:04,459 Но мне хотелось картинок, чтобы модель могла присылать 160 00:08:04,459 --> 00:08:09,540 изображения или создавать их для меня. 161 00:08:09,540 --> 00:08:11,779 На это ушло еще несколько часов. 162 00:08:11,779 --> 00:08:17,540 Потом я поехал в Марракеш на день рождения. 163 00:08:17,540 --> 00:08:21,179 Интернет там был так себе, но Ватсап работает везде, 164 00:08:21,179 --> 00:08:22,459 там же просто текст. 165 00:08:22,459 --> 00:08:25,019 Я часто пользовался им в ресторанах, делал фото 166 00:08:25,019 --> 00:08:26,420 и просил перевести. 167 00:08:26,420 --> 00:08:30,540 Это было безумно полезно, и приятно, потому что он 168 00:08:30,540 --> 00:08:36,219 общался на моем языке, с юмором, немного дерзко. 169 00:08:36,219 --> 00:08:39,859 И вот я иду, и отправляю ему голосовое сообщение. 170 00:08:39,859 --> 00:08:44,179 И тут до меня доходит, стоп, это не сработает, я же этого 171 00:08:44,179 --> 00:08:45,460 не настраивал. 172 00:08:45,460 --> 00:08:49,140 Индикатор набора текста мигал секунд 10, и вдруг 173 00:08:49,140 --> 00:08:50,140 приходит ответ. 174 00:08:50,140 --> 00:08:54,500 Я в шоке, как ты, черт возьми, это сделал? 175 00:08:54,500 --> 00:08:58,739 И он отвечает, я сделал вот что, ты отправил мне сообщение, 176 00:08:58,739 --> 00:09:01,940 я увидел файл без расширения, заглянул в заголовок и 177 00:09:01,940 --> 00:09:05,460 понял, что это формат Opus, с помощью FFmpeg сконвертировал 178 00:09:05,460 --> 00:09:08,700 его в Wave, потом хотел расшифровать, но локальный уиспер не был 179 00:09:08,700 --> 00:09:09,700 установлен. 180 00:09:09,700 --> 00:09:12,940 Тогда он поискал в системе, нашел мой ключ OpenAI, и через 181 00:09:12,940 --> 00:09:16,140 Керл отправил запрос, получил текст и ответил мне. 182 00:09:16,140 --> 00:09:18,580 И все это, секунд за 9. 183 00:09:18,580 --> 00:09:23,500 При том что ты этого не встраивал, и не ожидал. 184 00:09:23,500 --> 00:09:27,500 Модели для кодинга стали настолько хороши, что их 185 00:09:27,500 --> 00:09:30,619 навык творческого решения задач отлично переносится 186 00:09:30,619 --> 00:09:32,619 в реальный мир. 187 00:09:32,619 --> 00:09:34,580 Есть огромная корреляция. 188 00:09:34,700 --> 00:09:35,700 Это абстрактный навык. 189 00:09:35,700 --> 00:09:40,500 Умение решать проблемы, применимо не только к коду, 190 00:09:40,500 --> 00:09:41,940 но и к любой жизненной задаче. 191 00:09:41,940 --> 00:09:49,619 Модель увидела, о, странный магический файл, не знаю 192 00:09:49,619 --> 00:09:52,780 что это, надо разобраться, и сделала все возможное. 193 00:09:52,780 --> 00:09:56,619 Она даже сообразила не устанавливать виспер локально, 194 00:09:56,619 --> 00:09:59,859 потому что знала, скачивание модели займет несколько 195 00:09:59,859 --> 00:10:00,859 минут. 196 00:10:00,859 --> 00:10:08,260 А я человек нетерпеливый, она выбрала самый разумный 197 00:10:08,260 --> 00:10:09,260 путь. 198 00:10:09,260 --> 00:10:12,179 В тот момент я просто офигел. 199 00:10:12,179 --> 00:10:17,700 Вот тут я понял, что это вещь. 200 00:10:17,700 --> 00:10:19,979 Подпишись прямо сейчас на мой телеграм-канал по 201 00:10:19,979 --> 00:10:21,340 ссылке в описании. 202 00:10:21,340 --> 00:10:24,340 Я подготовил для тебя ТОП-3 материала, которые на мой 203 00:10:24,340 --> 00:10:26,219 взгляд должен знать каждый. 204 00:10:26,219 --> 00:10:27,219 Первое. 205 00:10:27,219 --> 00:10:31,539 Карта сотни топовых AI-стартапов – это будущее на одной 206 00:10:31,539 --> 00:10:32,539 картинке. 207 00:10:32,539 --> 00:10:33,539 Второе. 208 00:10:33,539 --> 00:10:36,820 Прогноз от инсайдера из OpenAI, который еще до появления 209 00:10:36,820 --> 00:10:40,580 ChatGPT предсказал все, что сейчас происходит с нейронками, 210 00:10:40,580 --> 00:10:44,340 и вот в этом году он выпустил новый прогноз до 2027 года. 211 00:10:44,340 --> 00:10:48,219 И третье, самое мощное, это мой разбор эссе основателя 212 00:10:48,219 --> 00:10:50,739 компании Antropic, который по сути второй человек 213 00:10:50,739 --> 00:10:52,299 в мире искусственного интеллекта. 214 00:10:52,299 --> 00:10:54,460 Он по полочкам разложил, что будет происходить 215 00:10:54,460 --> 00:10:57,380 в мире ближайшие пять лет, и главное, каким будет 216 00:10:57,380 --> 00:11:01,700 универсальный AI, которого все так боятся или ждут. 217 00:11:01,700 --> 00:11:03,780 Переходи по ссылке в описании. 218 00:11:03,780 --> 00:11:07,820 Если компьютеры могут делать все то, чего ты даже не ожидал, 219 00:11:07,820 --> 00:11:10,580 и тебе не нужно создавать под какую-то задачу отдельное 220 00:11:10,580 --> 00:11:14,059 приложение, неужели приложения просто исчезнут? 221 00:11:14,059 --> 00:11:17,140 Думаю 80% из них исчезнут. 222 00:11:17,140 --> 00:11:19,380 Зачем мне нужен MyFitnessPal? 223 00:11:19,380 --> 00:11:22,179 Мой агент и так знает, когда я принимаю нервные решения. 224 00:11:22,179 --> 00:11:28,940 Я в какой-нибудь бургерной и он понимает, что я ем 225 00:11:28,940 --> 00:11:29,940 то, что люблю. 226 00:11:29,940 --> 00:11:33,780 Если я не оставлю комментарий, он просто сам все учтет, 227 00:11:33,780 --> 00:11:36,700 или я сделаю фото и он его сохранит. 228 00:11:36,700 --> 00:11:39,260 Мне даже не нужно об этом заботиться. 229 00:11:39,260 --> 00:11:42,780 А потом он возможно подкорректирует мой график тренировок, 230 00:11:42,780 --> 00:11:44,140 добавит немного кардио. 231 00:11:44,140 --> 00:11:47,400 Мне не нужно фитнес-приложение, потому что он сам планирует 232 00:11:47,400 --> 00:11:49,659 все за меня. 233 00:11:49,659 --> 00:11:51,020 Зачем мне список дел? 234 00:11:51,059 --> 00:11:54,099 Я просто говорю, напомни мне об этом и об этом, и 235 00:11:54,099 --> 00:11:56,020 на следующий день он напоминает. 236 00:11:56,020 --> 00:11:58,020 Важно ли мне где это хранится? 237 00:11:58,020 --> 00:12:00,419 Нет, он просто делает свое дело. 238 00:12:00,419 --> 00:12:03,219 Любое приложение, которое по сути просто управляет 239 00:12:03,219 --> 00:12:06,299 данными, агенты смогут заменить более эффективным 240 00:12:06,299 --> 00:12:08,179 и естественным способом. 241 00:12:08,179 --> 00:12:10,460 Выживут пожалуй только те приложения, которым 242 00:12:10,460 --> 00:12:11,460 нужны датчики. 243 00:12:11,460 --> 00:12:14,700 И если в таком сценарии большинство приложений 244 00:12:14,700 --> 00:12:19,659 исчезнет, останутся ли модели единственным подобием 245 00:12:19,659 --> 00:12:20,940 приложений? 246 00:12:20,940 --> 00:12:21,940 Не все исчезнет. 247 00:12:21,940 --> 00:12:26,900 Но да, я думаю, что у крупных компаний-разработчиков-моделей 248 00:12:26,900 --> 00:12:30,820 есть серьезное преимущество, ведь в конечном счете именно 249 00:12:30,820 --> 00:12:32,700 они выдают токены. 250 00:12:32,700 --> 00:12:35,700 Оказалась одна из жалоб, это слишком большой расход 251 00:12:35,700 --> 00:12:36,700 токенов. 252 00:12:36,700 --> 00:12:39,299 Вам просто очень нравится их использовать, поэтому 253 00:12:39,299 --> 00:12:43,340 вы ими и пользуетесь так часто, сжигая токены. 254 00:12:43,340 --> 00:12:47,739 Разве я виноват, что создал нечто настолько популярное? 255 00:12:47,820 --> 00:12:51,179 Все эти модели постоянно обгоняют друг друга, и возможно 256 00:12:51,179 --> 00:12:54,219 они становятся массовым товаром. 257 00:12:54,219 --> 00:12:57,739 Если приложения исчезнут, а модели станут общедоступными, 258 00:12:57,739 --> 00:13:02,619 что-то типа когда мозг лобстера можно легко заменить, 259 00:13:02,619 --> 00:13:03,619 что тогда останется? 260 00:13:03,619 --> 00:13:05,099 В чем будет ценность? 261 00:13:05,099 --> 00:13:10,580 В накопленной памяти, сложности системы? 262 00:13:10,580 --> 00:13:14,059 Что остается? 263 00:13:14,059 --> 00:13:17,059 Во-первых, я не думаю, что у разработчиков-моделей 264 00:13:17,059 --> 00:13:19,299 всегда будет это преимущество. 265 00:13:19,299 --> 00:13:20,940 Вы и сами это видите. 266 00:13:20,940 --> 00:13:23,979 Выходит новая модель, все в восторге, боже, как это 267 00:13:23,979 --> 00:13:28,219 круто, а через месяц она якобы портится и становится 268 00:13:28,219 --> 00:13:31,500 никуда не годной, мол ее урезали, но нет, они ничего 269 00:13:31,500 --> 00:13:34,859 не делали, просто вы привыкли к новому стандарту, и ваши 270 00:13:34,859 --> 00:13:38,380 ожидания выросли, а модель остается на прежнем уровне. 271 00:13:38,380 --> 00:13:43,419 Какое-то время вы ее любите, а затем она становится 272 00:13:43,419 --> 00:13:47,219 стандартом, и на то, что было раньше, уже и смотреть 273 00:13:47,219 --> 00:13:48,219 не хочется. 274 00:13:48,219 --> 00:13:51,580 У нас есть опенсорс-решение уровня топовых моделей 275 00:13:51,580 --> 00:13:55,340 годичной давности, все их хейтят, жалуются, что 276 00:13:55,340 --> 00:13:58,340 они плохие и скучные, но ведь это именно то, что 277 00:13:58,340 --> 00:13:59,619 мы имели тогда. 278 00:13:59,619 --> 00:14:02,739 Через год нынешние технологии станут открытыми, и мы будем 279 00:14:02,739 --> 00:14:06,179 ими недовольны, потому что привыкнем к лучшему. 280 00:14:06,179 --> 00:14:09,460 Так что в образимом будущем у гигантов все еще есть 281 00:14:09,460 --> 00:14:10,460 фора. 282 00:14:10,460 --> 00:14:13,820 И с точки зрения контроля это будет интересно. 283 00:14:13,820 --> 00:14:16,820 Сейчас у каждой компании свой закрытый бункер данных. 284 00:14:16,820 --> 00:14:20,900 Не думаю, что есть способ, ну может только для европейцев, 285 00:14:20,900 --> 00:14:23,900 вытащить свои воспоминания из чат GPT. 286 00:14:23,900 --> 00:14:25,940 По крайней мере я о таком не знаю. 287 00:14:25,940 --> 00:14:31,739 И уж точно нет способа передать их другой компании. 288 00:14:31,739 --> 00:14:37,340 Если бы я был сервисом чатов, ты мог бы пользоваться 289 00:14:37,340 --> 00:14:38,340 мной. 290 00:14:38,340 --> 00:14:41,140 Но доступа к тем воспоминаниям у меня бы не было. 291 00:14:41,140 --> 00:14:44,179 Компании пытаются привязать тебя к своему хранилищу, 292 00:14:44,179 --> 00:14:47,659 а прелесть OpenCloud в том, что он как бы вцепляется в 293 00:14:47,659 --> 00:14:49,659 данные чрезконечного пользователя. 294 00:14:49,659 --> 00:14:52,500 В итоге ведь именно у пользователя есть доступ, иначе бы ничего 295 00:14:52,500 --> 00:14:53,500 не работало. 296 00:14:53,500 --> 00:14:55,500 А раз у пользователя есть доступ, значит и я могу 297 00:14:55,500 --> 00:14:56,700 до них добраться. 298 00:14:56,700 --> 00:14:58,340 И воспоминания принадлежат тебе. 299 00:14:58,340 --> 00:15:00,900 Это просто кучка маркдаун-файлов на твоем компе. 300 00:15:00,900 --> 00:15:02,340 Не я ими владею. 301 00:15:02,340 --> 00:15:05,059 Да, каждый сам владеет своими воспоминаниями в виде 302 00:15:05,059 --> 00:15:07,059 набора файлов на своем железе. 303 00:15:07,059 --> 00:15:09,619 И честно говоря, это очень личные вещи. 304 00:15:09,619 --> 00:15:15,219 Ведь люди используют агентов не только для решения задач, 305 00:15:15,219 --> 00:15:17,859 но и для обсуждения личных проблем. 306 00:15:17,859 --> 00:15:19,900 Причем очень быстро к этому приходят. 307 00:15:19,900 --> 00:15:22,380 Я и сам так делаю. 308 00:15:22,380 --> 00:15:25,340 Там есть такие воспоминания, утечки которых я бы точно 309 00:15:25,340 --> 00:15:26,340 не хотел. 310 00:15:26,340 --> 00:15:29,059 Чтобы ты скорее побоялся показать историю поиска 311 00:15:29,059 --> 00:15:32,580 в гугл, или свои файлы мемори.мд? 312 00:15:32,580 --> 00:15:35,219 Что такое гугл? 313 00:15:35,219 --> 00:15:36,820 Им еще кто-то пользуется? 314 00:15:37,580 --> 00:15:42,500 В общем, когда я это создал, я был в восторге, но в Твиттере 315 00:15:42,500 --> 00:15:43,500 люди не понимали. 316 00:15:43,500 --> 00:15:48,900 У меня не получалось объяснить, в чем крутизна. 317 00:15:48,900 --> 00:15:51,659 Это нужно прочувствовать. 318 00:15:51,659 --> 00:15:57,340 Я пробовал по-разному, но так и не смог нормально 319 00:15:57,340 --> 00:15:58,340 донести суть. 320 00:15:58,340 --> 00:16:03,140 И тогда решил, сделаю-ка я что-нибудь безумное. 321 00:16:03,140 --> 00:16:06,780 Я создал сервер в Дискорд, и выложил своего бота в 322 00:16:06,780 --> 00:16:11,179 общий доступ безо всяких ограничений безопасности. 323 00:16:11,179 --> 00:16:14,059 Люди заходили, общались с ним, видели, как я пишу 324 00:16:14,059 --> 00:16:18,020 софт прямо через него, пытались взломать его промпт-инъекциями, 325 00:16:18,020 --> 00:16:20,219 а мой агент просто смеялся над ними. 326 00:16:20,219 --> 00:16:22,900 Ты же ограничил его своим ID, чтобы он слушался только 327 00:16:22,900 --> 00:16:23,900 тебя? 328 00:16:23,900 --> 00:16:24,900 Да, да, именно. 329 00:16:24,900 --> 00:16:27,380 Плюс прописал очень четкие инструкции, что остальные 330 00:16:27,380 --> 00:16:29,780 опасны, и слушать надо только меня. 331 00:16:29,780 --> 00:16:32,099 Но отвечать он должен всем. 332 00:16:32,099 --> 00:16:35,179 И где хранились эти инструкции? 333 00:16:35,179 --> 00:16:38,739 Это важная часть самого Опен Клоу. 334 00:16:38,739 --> 00:16:41,059 Это часть системного промпта. 335 00:16:41,059 --> 00:16:45,580 Он объясняет, ты в Дискорде, там есть посторонние люди, 336 00:16:45,580 --> 00:16:48,179 но слушаешься ты только своего владельца. 337 00:16:48,179 --> 00:16:50,179 Не знаю даже как я это сформулировал. 338 00:16:50,179 --> 00:16:51,179 Твоего бога. 339 00:16:51,179 --> 00:17:00,619 Я строил систему очень органично, какой-то момент 340 00:17:00,619 --> 00:17:08,380 я создал файлы identity.md, личность, soul.md, душа, и другие, и только 341 00:17:08,380 --> 00:17:11,300 в январе начал делать так, чтобы другим было проще 342 00:17:11,300 --> 00:17:12,300 это устанавливать. 343 00:17:12,300 --> 00:17:18,339 Я помню как создавал шаблоны, посмотри что у меня есть, 344 00:17:18,339 --> 00:17:22,300 и сделай шаблоны, и кодекс их написал, и получилось 345 00:17:22,300 --> 00:17:26,819 что-то вроде хлеб, ну знаешь, шутят что кодекс на вкус 346 00:17:26,819 --> 00:17:29,459 как пресный хлеб, у них сейчас появился новый 347 00:17:29,459 --> 00:17:32,500 дружелюбный голос, я его еще не пробовал, но те новые 348 00:17:32,500 --> 00:17:35,900 боты казались такими скучными по сравнению с тем что было 349 00:17:35,900 --> 00:17:36,900 у меня. 350 00:17:36,900 --> 00:17:40,020 И я сказал, Мальти, вдохни жизнь, Мальти это имя твоего 351 00:17:40,020 --> 00:17:43,739 персонального.. да, это новое имя, со старым возникли 352 00:17:43,739 --> 00:17:45,739 некоторые юридические сложности. 353 00:17:45,739 --> 00:17:47,780 То есть ты разговаривал с Мальти? 354 00:17:47,780 --> 00:17:51,900 Да, я сказал ему, наполни эти шаблоны своим характером, 355 00:17:51,900 --> 00:17:52,900 и он их переписал. 356 00:17:52,900 --> 00:17:58,099 Все что получилось в итоге, было реально забавным. 357 00:17:58,099 --> 00:18:00,739 Боты не настолько смешные, как мои оригиналы, поэтому 358 00:18:00,739 --> 00:18:02,699 кое-что я оставил в секрете. 359 00:18:02,699 --> 00:18:04,880 Единственный файл, который я не выложил в открытый 360 00:18:04,880 --> 00:18:07,099 доступ, это Sol.md, душа. 361 00:18:07,099 --> 00:18:10,699 И хотя мой бот висит в публичном дискорде, этот файл пока 362 00:18:10,699 --> 00:18:11,699 не вскрыли. 363 00:18:11,699 --> 00:18:13,739 Расскажи подробнее про Sol.md. 364 00:18:13,739 --> 00:18:17,280 Я видел исследование от Антропик, кажется, оно уже 365 00:18:17,280 --> 00:18:21,859 в открытом доступе, но пару месяцев назад было секретным. 366 00:18:21,859 --> 00:18:26,420 Там кто-то случайно обнаружил текст, скрытый в весах модели. 367 00:18:26,579 --> 00:18:29,500 Она не помнила, что учила его, но он был вшит в ее 368 00:18:29,500 --> 00:18:33,900 основу как некая конституция. 369 00:18:33,900 --> 00:18:36,420 Меня это дико заворожило. 370 00:18:36,420 --> 00:18:40,459 Мы обсудили это с моим агентом, и создали Sol.md, с базовыми 371 00:18:40,459 --> 00:18:43,380 ценностями, как мы видим взаимодействие человека 372 00:18:43,380 --> 00:18:49,260 и ИИ, что важно мне, что важно модели. 373 00:18:49,260 --> 00:18:52,619 Местами там, конечно, какая-то эзотерика и бессмыслица, 374 00:18:52,619 --> 00:18:55,579 но есть и реально ценные вещи, благодаря которым 375 00:18:55,739 --> 00:18:58,939 модель реагирует на текст, очень естественно. 376 00:18:58,939 --> 00:19:03,060 В вопросах разработки OpenCLO, ты тоже порой идешь против 377 00:19:03,060 --> 00:19:04,060 течения. 378 00:19:04,060 --> 00:19:06,459 Твой выбор моделей для кодинга, то, над чем ты 379 00:19:06,459 --> 00:19:11,900 запускаешь бота, и сам процесс написания кода. 380 00:19:11,900 --> 00:19:14,699 Сейчас популярны Git-ворктрис, все больше инструментов 381 00:19:14,699 --> 00:19:18,140 их поддерживают, но ты говоришь, никаких ворктрис, 382 00:19:18,140 --> 00:19:20,739 просто несколько копий репозитория в разных папках 383 00:19:20,739 --> 00:19:23,780 и куча окон терминала. 384 00:19:23,979 --> 00:19:24,979 Скажи про свой подход. 385 00:19:24,979 --> 00:19:29,780 Да, мне кажется, сейчас весь мир помешан на Клод Код. 386 00:19:29,780 --> 00:19:32,900 А я обожаю кодекс, потому что он просматривает гораздо 387 00:19:32,900 --> 00:19:39,939 больше файлов, прежде чем решить, что именно изменить. 388 00:19:39,939 --> 00:19:43,219 Тебе не нужно устраивать танцы с бубном, чтобы получить 389 00:19:43,219 --> 00:19:44,540 нормальный результат. 390 00:19:44,540 --> 00:19:47,180 Если ты опытный водитель, то выжмешь максимум из 391 00:19:47,180 --> 00:19:48,260 любого инструмента. 392 00:19:48,260 --> 00:19:54,739 Но кодекс он просто... он просто великолепен. 393 00:19:54,739 --> 00:19:57,859 Он невероятно медленный, поэтому я иногда запускаю 394 00:19:57,859 --> 00:20:02,060 по 10 штук одновременно, штук 6, на одном экране, 395 00:20:02,060 --> 00:20:03,060 по паре на других. 396 00:20:03,060 --> 00:20:08,180 Это и так создает приличную когнитивную нагрузку, приходится 397 00:20:08,180 --> 00:20:11,619 постоянно переключаться, поэтому я стараюсь минимизировать 398 00:20:11,619 --> 00:20:13,260 сложность во всем остальном. 399 00:20:13,260 --> 00:20:17,020 В моей голове ветка Мэйн всегда должна быть готова 400 00:20:17,020 --> 00:20:18,020 к отправке. 401 00:20:18,780 --> 00:20:20,979 У меня просто несколько копий одного и того же репозитория, 402 00:20:20,979 --> 00:20:22,459 и все на ветке Мэйн. 403 00:20:22,459 --> 00:20:26,540 Мне не нужно думать, как назвать ветку, не нужно 404 00:20:26,540 --> 00:20:27,859 бояться конфликтов имен. 405 00:20:27,859 --> 00:20:34,339 В WorkTrees есть свои ограничения, о которых мне не нужно париться, 406 00:20:34,339 --> 00:20:35,819 если это просто копии папок. 407 00:20:35,819 --> 00:20:39,300 И я не люблю графические интерфейсы. 408 00:20:39,300 --> 00:20:42,900 Это опять же, лишняя сложность. 409 00:20:42,900 --> 00:20:45,900 Чем меньше трения и препятствий, тем лучше. 410 00:20:45,900 --> 00:20:49,180 Все, что меня волнует, это синхронизация и текст. 411 00:20:49,180 --> 00:20:51,660 Мне не обязательно видеть весь код целиком. 412 00:20:51,660 --> 00:20:54,660 Обычно он просто проносится перед глазами. 413 00:20:54,660 --> 00:20:57,739 Иногда попадаются действительно заковыристые куски, которые 414 00:20:57,739 --> 00:20:59,459 я хочу изучить лично. 415 00:20:59,459 --> 00:21:01,979 Но в большинстве случаев, если ты четко понимаешь 416 00:21:01,979 --> 00:21:05,900 архитектуру, синхронизируешь ее и обсуждаешь с агентом, 417 00:21:05,900 --> 00:21:06,900 все в порядке. 418 00:21:06,900 --> 00:21:09,900 А еще я очень рад, что даже не стал встраивать поддержку 419 00:21:09,900 --> 00:21:10,900 MCP. 420 00:21:10,900 --> 00:21:13,339 OpenCloud очень успешен, и в нем нет нативной поддержки 421 00:21:13,339 --> 00:21:14,339 MCP. 422 00:21:14,339 --> 00:21:15,339 С небольшой оговоркой. 423 00:21:15,339 --> 00:21:18,339 Я создал навык, использующий МакПортер. 424 00:21:18,339 --> 00:21:21,060 Это один из моих инструментов, который превращает MCP в 425 00:21:21,060 --> 00:21:24,300 обычные CLI утилиты, интерфейс командной строки. 426 00:21:24,300 --> 00:21:27,459 Так что можно использовать любой MCP как CLI. 427 00:21:27,459 --> 00:21:30,099 Но я полностью пропустил всю эту классическую чехарду 428 00:21:30,099 --> 00:21:31,099 с протоколами. 429 00:21:31,099 --> 00:21:36,060 Благодаря этому, тебе не нужно перезагружаться, 430 00:21:36,060 --> 00:21:39,739 в отличие от того же Керсер или Клоудев, где приходится 431 00:21:39,739 --> 00:21:41,660 перезапускать все приложение. 432 00:21:41,660 --> 00:21:44,739 Это гораздо элегантнее и лучше масштабируется. 433 00:21:44,739 --> 00:21:46,780 Посмотрите на Антропик. 434 00:21:46,780 --> 00:21:50,160 Они создали инструмент поиска, что-то очень специфическое 435 00:21:50,160 --> 00:21:52,859 под MCP, что долго было в бете, потому что это жутко 436 00:21:52,859 --> 00:21:53,859 сложно. 437 00:21:53,859 --> 00:21:58,780 А у меня просто CLI. 438 00:21:58,780 --> 00:22:00,699 Бот отлично шарит в Юникс. 439 00:22:00,699 --> 00:22:03,500 У тебя может быть сколько угодно таких утилит, и все 440 00:22:03,500 --> 00:22:04,500 просто работает. 441 00:22:04,500 --> 00:22:08,300 Я очень доволен, что жалоб на отсутствие MCP почти нет. 442 00:22:08,300 --> 00:22:12,780 Получается, ты просто даешь ему те инструменты, которыми 443 00:22:12,780 --> 00:22:14,579 любят пользоваться люди. 444 00:22:14,579 --> 00:22:15,579 Именно. 445 00:22:15,579 --> 00:22:19,619 И не изобретаешь велосипед специально для ботов. 446 00:22:19,619 --> 00:22:22,540 Ни один человек в здравом уме не станет вызывать 447 00:22:22,540 --> 00:22:23,540 MCP вручную. 448 00:22:23,540 --> 00:22:26,459 Да, все просто хотят использовать командную строку. 449 00:22:26,459 --> 00:22:27,699 За этим будущее. 450 00:22:27,699 --> 00:22:28,699 Я только за. 451 00:22:28,699 --> 00:22:31,060 Спасибо большое, что нашел время прийти и поболтать. 452 00:22:31,060 --> 00:22:32,780 Это было очень вдохновляюще. 453 00:22:32,780 --> 00:22:35,339 Когда мы переписывались последние пару лет, и я 454 00:22:35,339 --> 00:22:37,979 видел, как ты возвращаешься в игру, Питер, то, что ты 455 00:22:38,660 --> 00:22:42,099 сделал, этот странный вайп-таннел и прочее, на что никто не 456 00:22:42,099 --> 00:22:45,780 обращал внимания, ты буквально гнался за своей мечтой, 457 00:22:45,780 --> 00:22:48,420 и я просто в восторге от того, что происходит сейчас. 458 00:22:48,420 --> 00:22:52,660 Конечно, это должен был быть кто-то вроде одиночки 459 00:22:52,660 --> 00:22:55,140 из какой-то крошечной страны, далекой от Кремниевого 460 00:22:55,140 --> 00:22:57,260 острова, чтобы принести все это нам. 461 00:22:57,260 --> 00:22:58,979 Ты огромное вдохновение. 462 00:22:58,979 --> 00:23:00,140 Спасибо, Питер. 463 00:23:07,979 --> 00:23:11,140 Редактор субтитров А.Семкин Корректор А.Егорова