Добавить новость
smi24.net
News in English
Август
2023

LLMs Are Taking Generative AI to a Higher Level

0

Large language models (LLMs) are lifting artificial intelligence (AI) to new heights by expanding its capabilities beyond text to include images, speech, video and even music. As they build, companies developing LLMs will contend with the challenges of collecting and classifying large amounts of data — as well as understanding the intricacies of how models now operate and how that differs from the previous status quo.

Technology giants such as Alphabet and Microsoft and investors such as Fusion Fund and Scale VC are investing in LLMs and forming partnerships. The technology companies’ and investors’ task is a big one. It includes ensuring their LLM protégés gather and train large data sets, called parameters, and fine-tune them so that they execute and generate desired outputs or results.

Understanding open- and closed-source models

Open-source models allow individuals or firms to access and modify the model’s design and code, permitting an open exchange of ideas as well as collaboration and transparency. Those who use open-source licenses to build products and services are expected not to charge for those services and to share the program’s source code, as in the web’s early days.

Closed-source models are considered proprietary intellectual property. As such, owners restrict the ability to view and modify the code. Usage of these models requires licenses and comes with restrictions on not changing the code. For these reasons, closed-source models tend to work better in general-purpose and consumer-oriented applications.

LLMs require effort to build and deploy

PYMNTS has simplified the detailed world of LLM development into several key categories. The first category — what we call classification and annotation — is about labeling data to assign meaning and imbue context. Training the data applies structured and unstructured learning to the data. This is followed by fine-tuning, in which the data is primed to generate specialized outputs.

Once ready, the model can be deployed to receive incoming queries or questions and generate contextually appropriate, relevant responses.

Classification and annotation make data usable. LLMs require data, classifications, context and process to fulfill their promise. Data in very large quantities is the main ingredient for LLMs. Richer data sets provide more material or input with which the model can train to learn how to generate a relevant response.

Data on its own is meaningless. To be useful to models, it needs to be sorted, labeled, measured, clustered and categorized in myriad different ways. If data is the raw material, classifications are its identifying labels. Classification and annotation can also imbue data with the right context and intent, conveying what a human means or intends to say, for example.

Steering these volumes of data through rule sets with correct context is a work in progress. The effort requires that the model reviews and connects the dots with whatever happened earlier or happens later in the chat or text.

Classification or annotation provides explanations or labels for each artifact in a data set later used to train LLMs. Training can be done through supervised learning (where the text is assigned a predefined class) or unsupervised learning (where it is grouped with similar text but with no instructions).

Training the data and then fine-tuning it is easier said than done. LLMs ingest large sets of clean data but require long periods of time — from three hours to 45 days, depending on the size of the data set — to pre-train and retrain to generate logical, contextual and accurate responses. Fine-tuning the model is far from automatic and takes considerable time.

A pre-trained LLM is ready to be fine-tuned: specialized for a defined, specific task. This may require that model parameters be revised. If the model needs to use tools or services accessible via an application programming interface (API), the training will need to account for that as well.

Deployment is the moment of truth. Once trained, a model is ready for deployment. This is where the rubber meets the road: LLMs receive and process incoming text and render an output or response. Instead of conveying the automated, canned responses typical of chatbots, LLMs can wow audiences with audio and video, and even music, as audiences can see the image of a human moving their mouth to speak and make sounds while making sensible, logical conversation.

It is a bonus if the pre-trained models have a feedback loop that allows them to improve with each iteration. This, however, is a nice-to-have option rather than table stakes.

The (winning) case for open source

Open-source models are popular because they are easily accessible and free — or have free versions, often with newer parameters. Access may be open, but the underlying tools, code, algorithm logic and infrastructure may not be. Most likely, open-source models’ owners may make a base model — with limited parameters — available to users, reserving the right to charge for a version with greater parameters. After all, larger numbers of parameters generate a higher cost of training.

Closed-source models are proprietary, with owners restricting the ability to view and modify the code. Their usage usage requires licenses, and users must trust the model owners’ integrity.

The post LLMs Are Taking Generative AI to a Higher Level first appeared on PYMNTS.com.








Как хранили продукты до изобретения холодильника: 5 способов

«Не думала, что младенцы могут столько не спать. Первые два дня я спала примерно полтора часа».

SUPER WEEKEND: денежные выходные с «Авторадио»

Ученые назвали привычку, вызывающую один из самых смертоносных видов рака


Exclusive: Fintech giant Stripe building ‘Tempo’ blockchain with crypto VC Paradigm

3 Terrifying Horror Series To Watch Ahead Of HBO’s ‘It: Welcome to Derry’

AI talent comes at a 30% salary premium: ‘If you try to play catch up later, this is going to cost you even more’

Amorim has seven Man Utd undroppables v Arsenal and four available positions


Вечер в розовом...

Дивеево

Почему у канализационной системы должен быть выход на крышу?

ВЦ «Раздолье» проведет бесплатный вебинар «Динамическая структура заказа в 1С:ERP»


Samsung has announced the world's first 500 Hz OLED monitor, but it's the new 5K2K panel that's got my wallet twitching

War Thunder Mobile празднует 2-ю годовщину с новым режимом и подарками

Список лучших PvE-питомцев для фарма в Etheria: Restart

Все персонажи Mafia: The Old Country из прошлых частей Mafia


Овочі можуть стати розкішшю для українців

Овочі можусть стати розкішшю для українців


В России представили автомобиль специально для такси

Москва ждет Кирилла Кирюхина в сентябре

Евгения Медведева: как обручальное кольцо "Тиффани" тронуло её маму до слёз

ДТП и смерть собаки. Невестка певицы Валерии рассказала о самом худшем дне


Дом вдали от дома: в Москве стартуют Дни культуры Татарстана

С 15 августа в зону резидентных разрешений вошли новые участки улиц

EVITA BEAUTY STORE - интернет-магазин косметики премиум-класса

Дотянуться до звезд: 35 лет назад погиб Виктор Цой


Запущенность глубинки России, но Москва впереди планеты всей: рейтинг и секреты

Московский блогер и стилист Алексей Сухарев высказался о провинциальности в Барнауле

Путин собрал "тяжёлую дипломатию": кто вошёл в команду России для битвы с Трампом на Аляске

Летнее тепло возвращается в Москву: температура поднимется до +25 °С


Калинская назвала несправедливым расписание турнира в Цинциннати

Хачанов не завершил матч на Цинциннати из-за травмы на "Мастерсе"

Рублёв удивился отсутствию выходного перед матчем с Комесаньей на турнире в Цинциннати

Соболенко победила Радукану и вышла в четвёртый круг турнира WTA в Цинциннати


Жителей Хакасии приглашают поучаствовать в цифровой Олимпиаде по охране труда

Московский блогер и стилист Алексей Сухарев высказался о провинциальности в Барнауле

Школьников научили разумно тратить деньги

В России на смену Telegram и WhatsApp идут другие сервисы


Музыкальные новости

Уникальное шоу Натальи Которевой «Женщина за 50» в Москве 20 сентября

В Курске на улице Ленина восстановили фонтан возле памятника Георгию Свиридову

Батрутдинов в роли Шурика, Кравец в образе Нины и 11 суперзвёзд: ТНТ готовит новый новогодний мюзикл-сюрприз для всей страны

Как мама SHAMAN`а контролирует его жизнь — Тимати еще повезло


Москва ждет Кирилла Кирюхина в сентябре

В России представили автомобиль специально для такси

ДТП и смерть собаки. Невестка певицы Валерии рассказала о самом худшем дне

Евгения Медведева: как обручальное кольцо "Тиффани" тронуло её маму до слёз


Клубный дом «Никитский 6» успешно прошел проверку Мосгосстройнадзора

В России представили автомобиль специально для такси

Миронов предложил ввести 13-ю пенсию для россиян к концу года

Алгоритмы Яндекс Музыки. Алгоритмы продвижения в Яндекс Музыка.


ДТП и смерть собаки. Невестка певицы Валерии рассказала о самом худшем дне

Дерзко, смешно, криминально: Comedy Radio рекомендует фильм «Геля»

Поиск верного пути развития: в Москве начал работу Международный Евразийский форум «Такси»

Очередь у Крымского моста увеличилась до 1,4 тысячи машин


Степашин высказался относительно переговоров Путина и Трампа на Аляске

Саммит Путина и Трампа в Анкоридже

Путин о Трампе и перспективах отношений между Россией и США

Путин и Трамп планируют произвести сенсацию: основные тайны предстоящей встречи на Аляске




Депздрав Москвы: в центре борьбы со СПИДом не требуется предъявлять паспорт

Сергей Собянин: Здание больницы станет волонтерским корпусом

Онкологический чекап в Alatau Lab – точная диагностика в Алматы

Врач-трихолог Мадина Осман: когда стоит прибегнуть к пересадке волос


В Киеве заявили, что высказывания Трампа содержат скрытую угрозу для Зеленского

В Киеве обеспокоены после переговоров Зеленского и лидеров ЕС с Трампом


ЦСКА предложил € 12 млн за полузащитника «Фиорентины» Бельтрана — источник

Евгения Медведева: как обручальное кольцо "Тиффани" тронуло её маму до слёз

«Динамо» призывает фанатов поддержать команду после неудачного старта

Константин Бучнев — спортивная гордость Майминского района Республики Алтай


Где люди, Шариф? Лукашенко напомнил главе Пакистана об его обещании

Доверенное лицо Лукашенко да вернули на высокую должность в Минздрав

«Буквально каждый белорус, с кем я разговаривал о политике, говорил, что Лукашенко - абсолютный псих»


Сергей Собянин. Главное за день

Собянин решил отреставрировать главное здание Павловской больницы

Собянин: Специалисты отреставрируют главное здание Павловской больницы

Собянин: Флагманский волонтёрский центр откроется в здании Павловской больницы


Никитин предложил разработать общую транспортную систему

Барнаульского гида осудили по делу о гибели девяти человек во время турпохода на Камчатке

«Будем биться за воду». Климатолог рассказал, какой будет жизнь в 2100 году

В Москве представили такси-версию электрокара «Атом»


Московский блогер и стилист Алексей Сухарев высказался о провинциальности в Барнауле

В России на смену Telegram и WhatsApp идут другие сервисы

«Вы исчерпали себя»: красноярский депутат предложил вице-губернатору Сергею Пономаренко уйти в отставку

В смерти «Вице-мисс Россия» Александровой призвали не винить ее мужа


Через четыре года в Архангельске у парусного центра «Норд» будет новое здание

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»

Универсальный ТСД промышленного класса Saotron RT-T40X V.2

Стартовала черновая отделка станции метро «Звенигородская» в Москве


Бойцы СВО из Крыма проходят реабилитацию в 12 центрах Социального фонда

Прогноз погоды в Крыму на 14 августа

Прогноз погоды в Крыму на четверг

Выставка - символ "И реет над Россией флаг"


Путин собрал "тяжёлую дипломатию": кто вошёл в команду России для битвы с Трампом на Аляске

Литературная гостиная. Марианесса Рождественская рассказала о своём творчестве

Школьников научили разумно тратить деньги

Запущенность глубинки России, но Москва впереди планеты всей: рейтинг и секреты














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *