Добавить новость
smi24.net
News in English
Май
2024

The quest to type Chinese on a QWERTY keyboard created autocomplete

0

This is an excerpt from The Chinese Computer: A Global History of the Information Age by Thomas S. Mullaney, published on May 28 by The MIT Press. It has been lightly edited.

ymiw2

klt4

pwyy1

wdy6

o1

dfb2

wdv2

fypw3

uet5

dm2

dlu1 …

A young Chinese man sat down at his QWERTY keyboard and rattled off an enigmatic string of letters and numbers.

Was it code? Child’s play? Confusion? It was Chinese.

The beginning of Chinese, at least. These forty-four keystrokes marked the first steps in a process known as “input” or shuru: the act of getting Chinese characters to appear on a computer monitor or other digital device using a QWERTY keyboard or trackpad.

Stills taken from a 2013 Chinese input competition screencast.
COURTESY OF MIT PRESS

Across all computational and digital media, Chinese text entry relies on software programs known as “Input Method Editors”—better known as “IMEs” or simply “input methods” (shurufa). IMEs are a form of “middleware,” so-named because they operate in between the hardware of the user’s device and the software of its program or application. Whether a person is composing a Chinese document in Microsoft Word, searching the web, sending text messages, or otherwise, an IME is always at work, intercepting all of the user’s keystrokes and trying to figure out which Chinese characters the user wants to produce. Input, simply put, is the way ymiw2klt4pwyy … becomes a string of Chinese characters.

IMEs are restless creatures. From the moment a key is depressed, or a stroke swiped, they set off on a dynamic, iterative process, snatching up user-inputted data and searching computer memory for potential Chinese character matches. The most popular IMEs these days are based on Chinese phonetics—that is, they use the letters of the Latin alphabet to describe the sound of Chinese characters, with mainland Chinese operators using the country’s official Romanization system, Hanyu pinyin. 

Example of Chinese Input Method Editor pop-up menu (抄袭 / “plagiarism”)
COURTESY OF MIT PRESS

This young man’s name was Huang Zhenyu (also known by his nom de guerre, Yu Shi). He was one of around sixty contestants that day, each wearing a bright red shoulder sash—like a tickertape parade of old, or a beauty pageant. “Love Chinese Characters” (Ai Hanzi) was emblazoned in vivid, golden yellow on a poster at the front of the hall. The contestants’ task was to transcribe a speech by outgoing Chinese president Hu Jintao, as quickly and as accurately as they could. “Hold High the Great Banner of Socialism with Chinese Characteristics,” it began, or in the original:  高举中国特色社会主义伟大旗帜为夺取全面建设小康社会新胜利而奋斗. Huang’s QWERTY keyboard did not permit him to enter these characters directly, however, and so he entered the quasi-gibberish string of letters and numbers instead: ymiw2klt4pwyy1wdy6…

With these four-dozen keystrokes, Huang was well on his way, not only to winning the 2013 National Chinese Characters Typing Competition, but also to clock one of the fastest typing speeds ever recorded, anywhere in the world.

ymiw2klt4pwyy1wdy6 … is not the same as 高举中国特色社会主义 …  the keys that Huang actually depressed on his QWERTY keyboard—his “primary transcript,” as we could call it—were completely different than the symbols that ultimately appeared on his computer screen, namely the “secondary transcript” of Hu Jintao’s speech. This is true for every one of the world’s billion-plus Sinophone computer users. In Chinese computing, what you type is never what you get.

For readers accustomed to English-language word processing and computing, this should come as a surprise. For example, were you to compare the paragraph you’re reading right now against a key log showing exactly which buttons I depressed to produce it, the exercise would be unenlightening (to put it mildly). “F-o-r-_-r-e-a-d-e-r-s-_-a-c-c-u-s-t-o-m-e-d-_t-o-_-E-n-g-l-i-s-h … ” it would read (forgiving any typos or edits). In English-language typewriting and computer input, a typist’s primary and secondary transcripts are, in principle, identical. The symbols on the keys and the symbols on the screen are the same.

Not so for Chinese computing. When inputting Chinese, the symbols a person sees on their QWERTY keyboard are always different from the symbols that ultimately appear on the monitor or on paper. Every single computer and new media user in the Sinophone world—no matter if they are blazing-fast or molasses-slow—uses their device in exactly the same way as Huang Zhenyu, constantly engaged in this iterative process of criteria-candidacy-confirmation, using one IME or another. Not some Chinese-speaking users, mind you, but all. This is the first and most basic feature of Chinese computing: Chinese human-computer interaction (HCI) requires users to operate entirely in code all the time.

If Huang Zhenyu’s mastery of a complex alphanumeric code weren’t impressive enough, consider the staggering speed of his performance. He transcribed the first 31 Chinese characters of Hu Jintao’s speech in roughly 5 seconds, for an extrapolated speed of 372 Chinese characters per minute. By the close of the grueling 20-minute contest, one extending over thousands of characters, he crossed the finish line with an almost unbelievable speed of 221.9 characters per minute.

That’s 3.7 Chinese characters every second.

In the context of English, Huang’s opening 5 seconds would have been the equivalent of around 375 English words-per-minute, with his overall competition speed easily surpassing 200 WPM—a blistering pace unmatched by anyone in the Anglophone world (using QWERTY, at least). In 1985, Barbara Blackburn achieved a Guinness Book of World Records–verified performance of 170 English words-per-minute (on a typewriter, no less). Speed demon Sean Wrona later bested Blackburn’s score with a performance of 174 WPM (on a computer keyboard, it should be noted). As impressive as these milestones are, the fact remains: had Huang’s performance taken place in the Anglophone world, it would be his name enshrined in the Guinness Book of World Records as the new benchmark to beat.

Huang’s speed carried special historical significance as well.

For a person living between the years 1850 and 1950—the period examined in the book The Chinese Typewriter—the idea of producing Chinese by mechanical means at a rate of over two hundred characters per minute would have been virtually unimaginable. Throughout the history of Chinese telegraphy, dating back to the 1870s, operators maxed out at perhaps a few dozen characters per minute. In the heyday of mechanical Chinese typewriting, from the 1920s to the 1970s, the fastest speeds on record were just shy of eighty characters per minute (with the majority of typists operating at far slower rates). When it came to modern information technologies, that is to say, Chinese was consistently one of the slowest writing systems in the world.

What changed? How did a script so long disparaged as cumbersome and helplessly complex suddenly rival—exceed, even—computational typing speeds clocked in other parts of the world? Even if we accept that Chinese computer users are somehow able to engage in “real time” coding, shouldn’t Chinese IMEs result in a lower overall “ceiling” for Chinese text processing as compared to English? Chinese computer users have to jump through so many more hoops, after all, over the course of a cumbersome, multistep process: the IME has to intercept a user’s keystrokes, search in memory for a match, present potential candidates, and wait for the user’s confirmation. Meanwhile, English-language computer users need only depress whichever key they wish to see printed on screen. What could be simpler than the “immediacy” of “Q equals Q,” “W equals W,” and so on?

COURTESY OF TOM MULLANEY

To unravel this seeming paradox, we will examine the first Chinese computer ever designed: the Sinotype, also known as the Ideographic Composing Machine. Debuted in 1959 by MIT professor Samuel Hawks Caldwell and the Graphic Arts Research Foundation, this machine featured a QWERTY keyboard, which the operator used to input—not the phonetic values of Chinese characters—but the brushstrokes out of which Chinese characters are composed. The objective of Sinotype was not to “build up” Chinese characters on the page, though, the way a user builds up English words through the successive addition of letters. Instead, each stroke “spelling” served as an electronic address that Sinotype’s logical circuit used to retrieve a Chinese character from memory. In other words, the first Chinese computer in history was premised on the same kind of “additional steps” as seen in Huang Zhenyu’s prizewinning 2013 performance.

During Caldwell’s research, he discovered unexpected benefits of all these additional steps—benefits entirely unheard of in the context of Anglophone human-machine interaction at that time. The Sinotype, he found, needed far fewer keystrokes to find a Chinese character in memory than to compose one through conventional means of inscription. By way of analogy, to “spell” a nine-letter word like “crocodile” (c-r-o-c-o-d-i-l-e) took far more time than to retrieve that same word from memory (“c-r-o-c-o-d” would be enough for a computer to make an unambiguous match, after all, given the absence of other words with similar or identical spellings). Caldwell called his discovery “minimum spelling,” making it a core part of the first Chinese computer ever built. 

Today, we know this technique by a different name: “autocompletion,” a strategy of human-computer interaction in which additional layers of mediation result in faster textual input than the “unmediated” act of typing. Decades before its rediscovery in the Anglophone world, then, autocompletion was first invented in the arena of Chinese computing.








В Москве прошла премия в области бизнеса, культуры и социальной сферы The Moscow Life & Business Awards – 2025

Город Бакуракерт на полуострове Ланжерон

В Москве прошла седьмая премия в области здоровья и красоты THE MEDICAL STARS & BEAUTY AWARDS

"Ушёл из жизни Николай Николаевич Мельничук


Jovic set for new opportunity after leaving Milan as free agent

£39m United star shouldn't be starting vs Arsenal, was gifting possession to Everton

Not even a 0% mortgage rate would make buying a house affordable in these 6 U.S. cities

Ricky Hatton Names The Best British Fighter Of All Time And It’s Not Lennox Lewis


Фридрихсбургские ворота

Ладожское утро...

Белые сны Турчасово...

В Курске 14-летние подростки украли из магазина 4 мотоцикла и запчасти


Android-игроки раскритиковали сурвайвл-хоррор Jericho: Survival

Girl Rescue 1.0.3.3

Обзор на мобильную версию A Game About Digging A Hole

Раскрой потенциал Мистера Террифика из DC Worlds Collide с этим гайдом



Концерты органной музыки в Москве: волшебство звуков в галерее Ильи Глазунова

«Турбозавры» на фестивале «Динозавры на каникулах» в ЦДМ на Лубянке

Два автобуса столкнулись на северо-востоке Москвы, движение перекрыто

Дептранс Москвы рекомендовал использовать метро из-за ограничения движения


В Москве прошла премия в области бизнеса, культуры и социальной сферы The Moscow Life & Business Awards – 2025

В Москве прошла премия «Триумф Года»

В Москве прошла седьмая премия в области здоровья и красоты THE MEDICAL STARS & BEAUTY AWARDS

Заместитель гендиректора туристической компании «IZI TOUR» Алена Фомина: что стоит посмотреть в Бодруме


В Подмосковье перед судом предстанет серийная похитительница велосипедов из многоэтажек во Власихе

Неожиданный побочный эффект выявлен у противогрибкового лекарства

Бешенство и хотелки: Запад фантазирует о воздушном перемирии России

Политолог Шаповалов: Саудовская Аравия, Турция и Индонезия могут войти в клуб ЯО


Рублёв проиграл Фрицу в 1/4 финала турнира ATP в Торонто

Костюк не дограла чвертьфінальний матч на турнірі WTA 1000 у Канаді

Теннисист Хачанов обыграл Микельсена и вышел в полуфинал турнира ATP

Рублев не достиг полуфинала турнира "Мастерс" в Торонто


Дмитриев и Уиткофф посетили ресторан в «Зарядье»

Суд оставил в силе решение о банкротстве бывшей жены Баскова Шпигель

FT: Пляжи мира оказались под угрозой исчезновения

Суд рассмотрит дело разгромившего чужие машины мужчины в Подмосковье


Музыкальные новости

Луи Дэниел Армстронг: 4 августа родился король джаза — человек, изменивший мир

Мировой суд в Москве взыскал с Тимати задолженность по взносам на капремонт

Музыкант Алексей Фомин рассказал о его друзьях

Рэпер ST хочет изучить Крым в свободное время


Два автобуса столкнулись на северо-востоке Москвы, движение перекрыто

Дептранс Москвы рекомендовал использовать метро из-за ограничения движения

«Турбозавры» на фестивале «Динозавры на каникулах» в ЦДМ на Лубянке

В Москве прошла премия «Триумф Года»


Музыкант Алексей Фомин поделился историей о его отношениях с друзьями

Авиационный отряд специального назначения Росгвардии, обеспечивающий охрану космодрома «Байконур» отметил 20-летие

Авиационный отряд специального назначения Росгвардии, обеспечивающий охрану космодрома «Байконур» отметил 20-летие

Москва и Санкт-Петербург: лидеры комфортной жизни для молодёжи России


Дептранс Москвы рекомендовал использовать метро из-за ограничения движения

Клиенты компании «Байкал Сервис» экономят на перевозке сезонных товаров

Два автобуса столкнулись на северо-востоке Москвы, движение перекрыто

Автобус попал в ДТП на трассе М-4 под Тулой: что рассказали пассажиры


Во Франции высказались о визите Уиткоффа в Москву

Сфотографировавшийся с Путиным мальчик из Китая обратился к нему спустя 25 лет

Малайзийский король посетил Россию с официальным визитом

Великое переселение офисов: Путин прогоняет чиновников из Москвы в регионы



В Москве задержали четверых сторонников ФБК за пожертвования организации

В Москве задержаны четверо мужчин по делу о пожертвованиях организации «ФБК»


К доктору – без страха: сеть клиник «Будь Здоров» представила VR-решения для детского здоровья

Как проверить качество получаемой медицинской помощи по ОМС...

В Москве прошла седьмая премия в области здоровья и красоты THE MEDICAL STARS & BEAUTY AWARDS

Благотворительное приложение Тубa открыло срочный сбор на протез для маленькой девочки


Зеленский добивается визита Эрдогана в Киев

«Хоть в платье, хоть в парике»: слухи о побеге Зеленского распространяются в Киеве


Профессиональные бои состоятся в Нижнем Новгороде 9 августа

«Ты будешь моей…»: Николай Ерусланкин из Нижнего Новгорода удивил всех участников шоу «Погоня» на ТНТ

В депо «Вязьма» отметили профессиональный праздник соревнованиями по лазертагу

Худайбердиева указала, что день смерти Гришина стал самым мрачным за последние годы


Лукашенко предупреждает: не стоит соревноваться с крупными государствами


Сергей Собянин: реставрация Большого Каменного моста завершена за 14 месяцев

Мэр Москвы рассказал о новой жизни Большого Каменного моста

Собянин открыл первый флагманский МФЦ для регистрации самоходной техники

Мэр Собянин поделился информацией о новорожденных животных в «Москвариуме»


Объем российского добычи водных биоресурсов превысил три миллиона тонн

В Подмосковье объявили «оранжевый» уровень опасности из-за угрозы наводнения

Зачем нужна программная нормализация воды после очистки — объясняет Алексей Горшков

Около 850 тысяч тонн вторсырья собрано в Москве за полгода


Алексей Тамаров – искусство пластической хирургии

Коньки круглый год: в «Лужниках» начнутся бесплатные тренировки на льду

FT: Пляжи мира оказались под угрозой исчезновения

Дмитриев и Уиткофф посетили ресторан в «Зарядье»


Алтайский край оказался одним из антилидеров по качеству автодорог

Коми, Камчатку, Архангельскую, Иркутскую, Калужскую, Костромскую, Курскую, Свердловскую и Оренбургскую области эксперты отнесли к регионам, где на осенних выборах "протестный потенциал выше среднего", говорится в докладе...

Амурская область оказалась в числе аутсайдеров по качеству дорог

Аномальная жара: До +41 °С в Чечне и Ингушетии, +30 °С в Карелии и Архангельске


Провокация Британии против РФ и рекорд цен на бензин – главное за день

В Симферополе вспомнили крымскую писательницу, пережившую оккупацию ребенком: 100 лет Елене Криштоф

Поезда в Крым меняют маршруты и график

Компания «Гранд Сервис Экспресс» информирует об изменениях в курсировании некоторых поездов «Таврия» с осени 2025 года


Опасные и неблагоприятные явления на реках, озерах и водохранилищах Российской Федерации по состоянию на 6 августа 2025 г.

Коньки круглый год: в «Лужниках» начнутся бесплатные тренировки на льду

В Москве прошла премия в области бизнеса, культуры и социальной сферы The Moscow Life & Business Awards – 2025

FT: Пляжи мира оказались под угрозой исчезновения














СМИ24.net — правдивые новости, непрерывно 24/7 на русском языке с ежеминутным обновлением *