Добавить новость
smi24.net
News in English
Июль
2023

Clibrain’s Lince: The LLM That Understands Spanish Like a Native Speaker

0

Clibrain, a Madrid-based AI startup, has joined the race to create generative AI models optimized for Spanish speakers. The company has released Lince Zero, a Spanish-instruction tuned LLM, which has been trained on a dedicated corpus of Spanish language data. Lince Zero is a 7BN parameter taster of a more powerful (foundational) model (40BN parameters) that the company has in the pipeline, which will simply be called Lince.

According to Clibrain, Spanish is one of the most spoken languages globally, boasting considerable variety in terms of dialects and variants. The company argues that this linguistic diversity makes it challenging for mainstream models to perform adequately on the Spanish language. Clibrain aims to address this gap by developing models that can parse and understand more Spanish linguistic nuance than the average LLM.

Clibrain’s LLM, Lince, is based on existing open source technologies. However, it is not just using existing architectures, touting its own senior engineering talent in AI. The startup was only founded in April 2023, with a multidisciplinary team of close to 30 staff with an R&D lab focused on generative AI at the core.

Clibrain’s co-founder and CEO, Elena Gonzalez-Blanco, brings an educational background in linguistics research and poetry to the startup, combined with a career focus on AI. She points back to her years doing linguistics research as powering a particularly key contribution to the project, enabling Clibrain to source unique training data to feed its model making ambitions.

“We have a corpus [of training data] which is unique,” she says. “I am a linguist; I have, let’s say, 15 years of research in terms of history of language, Spanish language… a lot of contacts that have not been used for training yet. So we have a unique corpus [as a differentiator].”

Clibrain’s debut model release is called Lince Zero and is being released under an open source license. This LLM is largely based on existing open source technologies, so it cannot yet boast its foundational model. However, the company says that’s coming soon.

The release of Lince Zero is the first step on Clibrain’s ambitious roadmap. It is largely based on existing open source technologies, so it cannot yet boast its foundational model. However, the company says that’s coming soon. As you can tell from the parameter numbers, these LLMs are far from contending to be the biggest models on the block. But, as Gonzalez-Blanco argues, Clibrain’s conviction is that model size, per se, won’t be the killer feature when it comes to generating a performance advantage around enhanced understanding of Spanish. Rather, quality attention to linguistic detail will count, and it hopes this will give it an edge in Spanish markets.

Clibrain’s Lince is far from the first conversational AI model to focus on Spanish. The Barcelona Supercomputing Center’s MarIA project, which launched back in 2021, claimed to be the first “massive” AI system in the Spanish language. Still, Clibrain argues it has surpassed MarIA and pulled together the most technologically “advanced” model focused on the Spanish speaking market to date.

There are a number of non-English language-optimized LLMs out there now, such as Baidu’s Chinese language model, Ernie, or this LLM model family that’s being tuned for German. South Korean tech giant Naver is also working on generative AI models trained on Korean.

However, Clibrain contends that its full focus on the Spanish language will enable its forthcoming foundational model, plus a series of domain-trained models it plans to develop atop the big one, to parse and understand more Spanish linguistic nuance than the average LLM.

Lince Zero’s performance is equivalent to GPT-3, whereas Clibrain says MarIA’s performance is equivalent to GPT-2. Although benchmarking linguistic performance of LLMs is a cutting-edge business in and of itself, Clibrain is encouraging Spanish speakers to check out what it’s built and start generating feedback.

Clibrain’s co-founders have been bootstrapping development so far, using funds gleaned from previous startup exits. The company doesn’t have a hefty investor roster nor deep funding warchest as yet. Gonzalez-Blanco says they had wanted to focus on developing core models and getting their first products to market, rather than on external fundraising. Still, the company may look to raise a bigger round of investment than the founders were able to plough in themselves as they continue to progress with the Lince product roadmap.

First reported on TechCrunch

Frequently Asked Questions

Q: What is Clibrain and what is its goal?

A: Clibrain is a Madrid-based AI startup focused on creating generative AI models optimized for Spanish speakers. The company aims to develop models that can parse and understand Spanish linguistic nuance better than existing language models.

Q: What is Lince Zero?

A: Lince Zero is Clibrain’s debut model release. It is a Spanish-instruction tuned Language Model (LLM) trained on a dedicated corpus of Spanish language data. Lince Zero is a 7 billion parameter model and serves as a preview of Clibrain’s more powerful foundational model, Lince, which has 40 billion parameters and is currently in development.

Q: What makes Clibrain’s approach unique?

A: Clibrain differentiates itself by leveraging its unique corpus of training data, sourced through the linguistics research background of its co-founder and CEO, Elena Gonzalez-Blanco. The company combines existing open source technologies with its own senior engineering talent in AI to develop its models.

Q: How does Clibrain’s LLM compare to other conversational AI models in the Spanish language?

A: Clibrain contends that its focus on the Spanish language enables its models to outperform other existing models, including the Barcelona Supercomputing Center’s MarIA project. Clibrain claims to have the most technologically advanced model for the Spanish-speaking market.

Q: What are Clibrain’s plans for the future?

A: The release of Lince Zero is the first step in Clibrain’s roadmap. The company plans to develop its foundational model, Lince, and a series of domain-trained models. They aim to provide enhanced understanding of Spanish through quality attention to linguistic detail.

Q: How does Lince Zero’s performance compare to other models?

A: Clibrain states that Lince Zero’s performance is equivalent to OpenAI’s GPT-3 model, while suggesting that MarIA’s performance is equivalent to GPT-2. However, benchmarking linguistic performance of language models is an ongoing process.

Featured Image Credit: Unsplash

The post Clibrain’s Lince: The LLM That Understands Spanish Like a Native Speaker appeared first on ReadWrite.








Кубок Федерации: спортивный праздник в формате светского пикника под музыку Relax FM

Ученые назвали привычку, вызывающую один из самых смертоносных видов рака

Опыт «ЛокоТех» в области менеджмента качества будет учтен при создании отраслевых ГОСТов

Украина со стороны Азербайджана атаковала астраханский порт. Под удар попало грузовое судно


3 Terrifying Horror Series To Watch Ahead Of HBO’s ‘It: Welcome to Derry’

Vintage photos show Alaska before it became a state

'You’ll never walk alone': Liverpool pays heartfelt tribute to Diogo Jota and Andre Silva - Watch

Amorim has seven Man Utd undroppables v Arsenal and four available positions


Пришли на время - остались навсегда

SIMETRA разработала транспортную модель участка дороги для поселка Шушары в Санкт-Петербурге

НПС в деловой программе автопробега БРИКС

В Курской области у бывшего сотрудника ГИБДД выявлено 5 млн рублей незаконных доходов


War Thunder Mobile празднует 2-ю годовщину с новым режимом и подарками

Samsung has announced the world's first 500 Hz OLED monitor, but it's the new 5K2K panel that's got my wallet twitching

Все персонажи Mafia: The Old Country из прошлых частей Mafia

Список лучших PvE-питомцев для фарма в Etheria: Restart


Овочі можуть стати розкішшю для українців


"Локомотив" и "Балтика" сыграли вничью со счетом 1:1 в матче пятого тура РПЛ

Кураторские Плейлисты. Кураторские плейлисты Яндекс Музыка.

Матч «Динамо» — ЦСКА 17 августа 2025 года: когда начало и где смотреть

Священник Волков назвал икону Германа от Путина символом единства России и США


Священник Волков назвал икону Германа от Путина символом единства России и США

Шансы на «бабье лето». Чего ждём от погоды в августе и сентябре

Мощный пожар охватил склад с товарами на 1 миллиард рублей на юге Москвы

ТРАМП МОГ НЕ ПОДМЕНИТЬ ПУТИНА РАДИ ПРЕМИИ МИРА?! ВЫСШАЯ АКАДЕМИЯ УПРАВЛЕНИЯ МИРОМ: ПРОГРАММНЫЕ ИНТЕЛЛЕКТЫ ПОМОГАЮТ! Россия, США, Европа могут улучшить отношения и здоровье общества!


В Москве загорелся склад у станции МЦД "Щербинка"

Синоптики предупреждают: аномальная зима уже близко — узнайте, что ждет россиян

МЧС: пожар в Новой Москве локализован на 600 "квадратах"

Поворот судьбы. Что стало со звездой «Курьера» Немоляевой


Кудерметова обыграла Таусон и вышла в четвёртый круг турнира WTA в Цинциннати

Россиянка Кудерметова прошла в полуфинал турнира WTA в США

Соболенко проиграла Рыбакиной в четвертьфинале турнира WTA-1000 в Цинциннати

Зверев достиг полуфинала турнира "Мастерс" в Цинциннати


Лужков и святыни Москвы: уникальная выставка в Храме Христа Спасителя

«Безумный Макс», супербег и мегаэмоции: первый день фестиваля фестиваль Ultra100 собрал тысячи гостей

Риккьярдо попал в больницу после аварии на мотоцикле

Глейхенгауз: российским фигуристам будет сложно после возвращения к международным стартам


Музыкальные новости

Чемпионат Московской области по футболу

«Она чудо!» — Алена Шишкова о новорожденной дочери рэпера Тимати

Звезда по имени Солнце: неизвестные страницы из биографии Виктора Цоя

В Санкт-Петербурге поклонники группы «Кино» почтили память Виктора Цоя


Матч «Динамо» — ЦСКА 17 августа 2025 года: когда начало и где смотреть

Кураторские Плейлисты. Кураторские плейлисты Яндекс Музыка.

1 В Коктебеле стартовал фестиваль «Скажите JAZZ!»

"Локомотив" и "Балтика" сыграли вничью со счетом 1:1 в матче пятого тура РПЛ


Выставка «Та самая Москва» расскажет о становлении городского электротранспорта

В аэропорту Внуково сняли огромные очереди к паспортному контролю

Кураторские Плейлисты. Кураторские плейлисты Яндекс Музыка.

Михаил Ефремов принес букет роз на могилу отца на Новодевичьем кладбище


Движение на юго-востоке Москвы затруднено на 1,7 километра из-за ДТП

Машина каршеринга пробила заграждение и упала в реку в Москве

Садовое кольцо и несколько улиц в центре Москвы перекроют 17 августа

Лексус проехал на красный и стал причиной падения каршеринга в реку Москвы


Священник Волков назвал икону Германа от Путина символом единства России и США

Мнение специалиста: встреча Путина и Трампа стала ключевым событием в истории

Американский аналитик дал оценку результатам встречи Путина и Трампа

Путин поделился деталями обсуждений с Трампом




Полиция задержала инвалида-колясочника за проявление расизма во время матча Английской премьер-лиги

Роспотребнадзор выявил кишечные бактерии в пиве «Жигули барное экспорт»

Удобный и без вреда для осанки: как выбрать рюкзак для первоклассника

Способы экспертного определения наличия вирусов в смартфоне


В Киеве подтвердили информацию о телефонном разговоре Трампа с Зеленским

Политолог Фельдман: страшный сон Зеленского стал явью

Киев повышает ставки: Зеленский поставил ультиматум Трампу

«Теперь все зависит от Зеленского»: Вашингтон и Москва договорились, а Киеву осталось лишь подписать капитуляцию


Матч «Динамо» — ЦСКА 17 августа 2025 года: когда начало и где смотреть

Спортсменка Росгвардии стала чемпионкой России по современному пятиборью

ЦСКА усилился форвардом Даниэлем Руисом: сразу до конца сезона 2025/26

"Локомотив" и "Балтика" сыграли вничью со счетом 1:1 в матче пятого тура РПЛ


Инициатива президента США вызвала разговор Лукашенко и Трампа

В определённых кругах это называется "Зайти на плечах"

Лукашенко прогнозирует успех переговоров Путина и Трампа на Аляске

Лукашенко проинформировал Трампа о планах по освобождению заключенных


Москва 2030: Сергей Собянин о планах развития на форуме с 2,5 млн посетителей

Собянин: Новый путепровод в Коммунарке разгрузит Калужское шоссе и дороги НАО

Собянин: Москва помогает бизнесу выводить инновационные разработки на рынок


В Москве показали такси будущего для городов России

Бирюлёво Восточное: дендропарк и не только (Мой район)

Нейтриновольтаика - энергетическое бестопливное будущее планеты


Лужков и святыни Москвы: уникальная выставка в Храме Христа Спасителя

Поворот судьбы. Что стало со звездой «Курьера» Немоляевой

В Брянске по подозрению во взятке заключен под стражу начальник отдела таможни

«Безумный Макс», супербег и мегаэмоции: первый день фестиваля фестиваль Ultra100 собрал тысячи гостей


Архангельские врачи из «Семашко» провели сложную операцию по удалению опухолей сразу двух органов

Родина российского триколора: в Петровском сквере установят стелу в честь национального флага

Владимир Ефимов: Станция «Бульвар Генерала Карбышева» Рублево-Архангельской линии метро готова более чем наполовину

Уполномоченный по защите прав предпринимателей в НАО совместно с заместителем прокурора региональной прокуратуры провели прием предпринимателей


Что лечит травматолог: основные заболевания и травмы

Бойцы СВО из Крыма проходят реабилитацию в 12 центрах Социального фонда

Крым в лидерах по числу турпоездок

Преимущества работы с агентством недвижимости: услуги, этапы


Глейхенгауз: российским фигуристам будет сложно после возвращения к международным стартам

В Москве загорелся склад у станции МЦД "Щербинка"

«Зенит» пробил уже 4 пенальти в пяти турах РПЛ

Михаил Ефремов принес букет роз на могилу отца на Новодевичьем кладбище














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *