Добавить новость
smi24.net
News in English
Июль
2024

AI Evaluation Initiative Could Boost Commercial Adoption

0

Anthropic’s new funding program for advanced artificial intelligence (AI) evaluations could accelerate the adoption of AI across various commercial sectors, industry experts say. 

The AI company announced Tuesday it will fund third-party organizations to develop new methods for assessing AI capabilities and risks, addressing a critical gap in the rapidly evolving field.

The initiative seeks to create more robust benchmarks for complex AI applications, potentially unlocking billions in commercial value. As businesses look to deploy AI solutions, the lack of comprehensive evaluation tools has been a barrier to widespread adoption.

“We’re seeking evaluations that help us measure the AI Safety Levels (ASLs) defined in our Responsible Scaling Policy,” Anthropic stated in its announcement. These levels determine safety and security requirements for models with specific capabilities.

Checking for Threats

Key focus areas include assessments of AI models’ potential cybersecurity capabilities, such as vulnerability discovery and exploit development. The company also seeks “evaluations that assess two critical capabilities: a) the potential for models to significantly enhance the abilities of non-experts or experts in creating CBRN [chemical, biological, radiological and nuclear] threats, and b) the capacity to design novel, more harmful CBRN threats.”

The impact of this funding program is expected to be particularly significant for complex AI applications. “Straightforward applications like speech recognition already have decent benchmarks, but quantifying a model’s capability in assisting a crime is much more difficult,” Julija Bainiaksina, founder of the AI company MiniMe, told PYMNTS.

Improved benchmarks could address critical challenges in AI adoption for businesses. “The main problems of adapting generative AI at the moment are cost, hallucinations and safety,” Ilia Badeev, head of data science at Trevolution Group, told PYMNTS. “While the first is relatively predictable and controllable, the latter two are a pain and a breaking point for many projects and integrations.”

The initiative comes as significant tech companies race to develop increasingly powerful AI models, raising concerns about potential misuse. Anthropic, founded by former OpenAI researchers, has positioned itself as a “responsible” AI development leader.

“A robust, third-party evaluation ecosystem is essential for assessing AI capabilities and risks,” Anthropic emphasized. The company added that “developing high-quality, safety-relevant evaluations remains challenging, and the demand is outpacing the supply.”

What Makes a Good Evaluation?

Anthropic outlined several principles for good evaluations, including that they should be “sufficiently difficult” and “not in the training data.” The company stressed the importance of domain expertise: “If the evaluation is about expert performance on a particular subject matter (e.g., science), make sure to use subject matter experts to develop or review the evaluation.”

The company is accepting proposals through an online application form on a rolling basis. Its internal experts will work closely with selected teams to refine evaluation methods, noting that “refining an evaluation typically requires several iterations.”

Anthropic’s initiative could have far-reaching implications for the commercial AI landscape. By creating more reliable and comprehensive evaluation methods, businesses may gain the confidence to deploy AI solutions in critical areas such as healthcare, finance and customer service. This could potentially unlock productivity gains and new revenue streams across industries.

However, the success of this program will largely depend on the quality and relevance of the evaluations developed. If the new benchmarks fail to capture real-world scenarios adequately or are too narrowly focused, they may provide a false sense of security.

The challenge lies in creating rigorous evaluations to ensure safety and flexibility to keep pace with rapidly evolving AI capabilities. As the initiative unfolds, monitoring how well the resulting evaluations translate to practical commercial applications will be crucial.

For all PYMNTS AI coverage, subscribe to the daily AI Newsletter.

The post AI Evaluation Initiative Could Boost Commercial Adoption appeared first on PYMNTS.com.








Рок-фестиваль «Окна Открой» в Петербурге: возвращение звезд и открытие новых талантов

Яблоня Сиверса: как скромный аптекарь открыл прародительницу всех яблок

Антитела альпак помогли ученым создать новые методы лечения рака

Семейное приключение на «Кораблике Детского радио»


Exclusive: Fintech giant Stripe building ‘Tempo’ blockchain with crypto VC Paradigm

AI talent comes at a 30% salary premium: ‘If you try to play catch up later, this is going to cost you even more’

Report: Liverpool decision hands advantage to Man United in midfielder pursuit

Palestinian envoy urges action at UN: “History will judge us all”


Чудо-колонка Детского радио: малыш будет в восторге!

В Курске суд постановил возместить расходы, которые инвалид понёс на покупку дорогостоящего лекарства

Nexign Interconnect получила сертификат совместимости с российской Java-платформой Axiom JDK

Обновлена платформа для мониторинга данных Smart Monitor


New study shows that Gen Z is spending way less money on videogames than older gamers

Открыты сервера MMORPG ROM: Golden Age

Modders are trying their hardest to add an NVMe SSD to the Switch 2, which is both impressive and something I'm not going to do

The US Air Force wants to test blowing up Cybertrucks because 'it is likely the type of vehicles used by the enemy may transition to Tesla Cyber trucks'


Овочі можусть стати розкішшю для українців


Платформа «DатаРу Облако» аттестована для работы с государственными данными и информацией повышенной категории

Побывавший в космосе объектив «Швабе» стал частью коллекции Политехнического музея

Директор Росгвардии Герой России генерал армии Виктор Золотов принял участие в заседании Национального антитеррористического комитета

Nexign Interconnect получила сертификат совместимости с российской Java-платформой Axiom JDK


Семейное приключение на «Кораблике Детского радио»

Антиармянские публикации в российском научном журнале «Современная научная мысль»: расследование фонда «Гегард»

Продвижение в Телеграм. Продвижение канала в Телеграм.

Сотрудники Росгвардии пришли на помощь пенсионеру, внезапно потерявшему сознание в кафе на востоке столицы


Москве выявлено около двух тысяч правонарушений среди мотоциклистов

Марадишвили попал в стартовый состав «Акрона» на матч с ЦСКА

Акции «М.Видео» выросли на новостях о планах JD.com стать совладельцем компании

Учителя и власти из Московской области — за внедрение ИИ в школы. Почему?


Павлюченкова уступила во втором круге турнира WTA 1000 в Цинциннати

Анна Калинская вышла в третий круг турнира WTA 1000 в Цинциннати

Теннисист Медведев проиграл австралийцу Уолтону и выбыл из турнира Цинциннати

Зверев пробился в третий раунд турнира "Мастерс" в Цинциннати


На Камчатке вулкан Ключевской вновь извергнул пепел

За сутки в Чите отловили 16 собак

В Шанхае и Сямыне покажут «Чайку» Константина Хабенского

Марадишвили попал в стартовый состав «Акрона» на матч с ЦСКА


Музыкальные новости

Анастасия Волочкова как могла объяснила свое странное поведение в самолете: «Любой человек был бы счастлив, что мои ноги висят над его головой»

Продвижение Песни. Раскрутка Песни. Продвижение Музыки. Раскрутка Музыки.

Фестиваль «Шаляпин. Рождение художника» пройдёт в Заповедных кварталах в конце августа

«Хотел меня увезти в Эмираты»: Анастасию Волочкову чуть не похитили на красной дорожке


Директор Росгвардии Герой России генерал армии Виктор Золотов принял участие в заседании Национального антитеррористического комитета

Платформа «DатаРу Облако» аттестована для работы с государственными данными и информацией повышенной категории

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления

Nexign Interconnect получила сертификат совместимости с российской Java-платформой Axiom JDK


Минниханов и председатель «Автодора» обсудили развитие дорожной сети Татарстана

"Начинаем привыкать". Бизнес и власти о том, как россиянам жить в эпоху интернет-блэкаутов

Команда из Удмуртии заняла призовое место на Чемпионате Приволжского округа Росгвардии по мини-футболу

Всё об операциях на почках: показания, какие бывают и как проходят


В Москве на видео попало, как подростка на электросамокате отбросило под автобус

Baza: Мотоциклист попал в ДТП в Москве из-за нарушившего ПДД водителя

Хуснуллин по видеосвязи поприветствовал участников автопробега БРИКС

Выяснились детали смертельной аварии с участием 16-летних самокатчиков на западе Москвы


Почему Трамп сказал, что едет в Россию, если встреча назначена в Аляске

Bloomberg: встреча Путина и Трампа сама по себе представляет победу Москвы

В России объяснили скорую организацию встречи Путина и Трампа

Почему Трамп захотел быстро встретиться с Путиным, объяснил Хазин




Главный врач клиники микрохирургии глаза АйМед Элина Санторо: что делать если лопнул сосуд в глазу

Подмосковный травматолог дал советы по выбору рюкзака для первоклассника

Здоровье Бориса Щербакова: обновленные сведения от научно-исследовательского центра имени Склифосовского

Клинический психолог Юлия Тарибо: психологические последствия удаленной работы и способы их преодоления


«Будет обмен землей»: Трамп поставил Зеленского на место, вызвав панику в Киеве

Политолог: Алиев пересек красную линию и столкнется с ответом Москвы


«Лето в Москве» в Южном округе объединит спорт, искусство и технологии в ближайшие выходные

Соревнования по многоборью кинологов-росгвардейцев завершились в Грозном

Росгвардейцы охраняли правопорядок на фестивале «ЛИГА ТРИАТЛОНА & IRONSTAR МОСКВА 2025»

На пенсии отоспишься. 13 идей для ночного досуга в Москве — от тенниса до парилки


Лукашенко получил первую золотую монету из белорусского сырья


Собянин объявил об открытии новой детской поликлиники в районе Крюково

Собянин рассказал о строительстве нового путепровода на северо-востоке Москвы

Собянин оценил вклад проектов "Город героев" и "Герой моего района

Ивлеева предположила, что Трамп увидит метро Москвы и увезет Собянина в США


Хватит морщиться: ученые назвали пользу от участившихся московских ливней

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»

Что подготовили в павильонах «Музеона» в рамках форума «Москва 2030»

В Крыму потушили угрожавший двум селам природный пожар


Самарский клуб победит на «Фиште»? «Сочи» — «Крылья Советов»: прогноз и ставка

Мастера из НАО удостоились высоких наград в Москве

Марадишвили попал в стартовый состав «Акрона» на матч с ЦСКА

Дорожные камеры в Зеленограде начали фиксировать выключенные днем фары


Здание морского речного вокзала в Архангельске будет обновлено к концу 2026 года

без заголовка

Полицейский погиб при задержании поджигателя релейного шкафа под Архангельском

Орловская область планирует войти в число национальных туристических маршрутов с проектом «Бирюзовое кольцо России»


Прогноз погоды в Крыму на понедельник

Историко-краеведческая выставка «Древности земли крымской»

Прогноз погоды в Крыму на 11 августа

Прогноз погоды в Крыму на 10 августа


Эксперт исключил вероятность резкого сокращения поставок нефти из России в Индию

Сервисное локомотивное депо «Унеча» признано образцом благоустройства

Ракова заявила о сокращении сроков ожидания эндоскопических исследований

Дорожные камеры в Зеленограде начали фиксировать выключенные днем фары














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *