DeepSeek янги СИ ўқитиш усулини таклиф этди
Китойлик DeepSeek компанияси 2025 йилда сунъий интеллектнинг асосий моделларини ўқитишда ресурсларни тежаш учун янги усулни тақдим этди, деб 3dnews.ru хабар берди. Ушбу усул — «гиперсвязи с ограничением на многообразие» (mHC) деб номланади ва у модellarнинг иқтисодий самарадорлигини оширишга ёрдам беради. Бу усул Американи рақобатлашувчи ИИ ечимлари билан бир хил даражада бўлишни таъминлайди, улар эса катта ҳисоблаш ресурсларига эга.
DeepSeek дафтаридаги илмий ишда 3 миллиард, 9 миллиард ва 27 миллиард параметрга эга моделлар бўйича мHC усули синовдан ўтказилгани ва бу усулнинг ҳисоблаш юкламасида анча камайишга олиб келгани таъкидланди. Моделларнинг ишлаш жараёнида бу усул билан мавжуд гиперсвязи усуллари ўртасида хавфсиз ва тезкор ўзаро алоқа ўрнатилгани айтилади.
DeepSeek бу усулни янги моделларини ишлаб чиқишда қўлламоқда ва бу ерда компаниянинг кибербозордаги муваффақиятли илмий йўналишлари намоён бўлиши мумкин.
