
Информационный гигант — компания Microsoft запустила мультимодальную модель искусственного интеллекта (ИИ) Kosmos-1. Программа умеет анализировать содержание изображений, решать графические головоломки, распознавать текст, проходить визуальные тесты на IQ и понимает текстовые команды, написанные в произвольной форме. Об этом сообщил «Cursor Іnfo».
Ученые называют создание мультимодального ИИ, способного работать в текстовом, аудио- и графическом режимах, включая видео, ключевым шагом на пути формирования AGI — общего искусственного интеллекта, который сможет решать многопрофильные задачи так же, как и люди. Мультимодальное восприятие информации является необходимым элементом для создания AGI в контексте получения знаний и связи с реальным миром.
Создание AGI позволит полностью заменить людей при выполнении любых интеллектуальных задач. Это является конечной целью OpenAI, ключевого партнера Microsoft в сфере ИИ. В презентационном сообщении Microsoft сказано:
«Kosmos-1 является проектом исключительно Microsoft. Исследователи называют свою работу «мультимодальной большой языковой моделью» (MLLM). Для понимания изображения по аналогии с ChatGPT новая система преобразует иллюстрацию в серию преимущественно текстовых «токенов», которые анализируются вычислительной машиной. В дальнейшем текст и другие элементы обрабатываются специальным декодером».
Как стремительное развитие ИИ отразится на интеллектуальном развитии человечества и его безопасности — пока не понятно.
Ранее, в статье «Александр Ханфф: ChatGPT следует уничтожить», мы сообщали о лживых сообщениях ИИ. Призываем наших читателей пользоваться только проверенными источниками информации. Новые сообщения оперативно публикуется на нашем Telegram-канале.
Вы можете поделиться этой статьей: