パスワードを忘れた? アカウント作成

yasuokaさんのトモダチの日記みんなの日記も見てね。 みんなの日記の更新状況はTwitterの@sradjp_journalsでもチェックできます。

13640894 journal
アメリカ合衆国

yasuokaの日記: MIT Technology Reviewの考えるQWERTY配列

日記 by yasuoka

私(安岡孝一)の『パソコンのキーボードは,なぜABC順・五十音順ではないのですか』の読者から、Mariana Mazzucatoの『デジタル経済を独占するグーグルやフェイスブックと私たちはどう付き合うべきか』(MIT Technology Review、2018年7月7日)を読んでみてほしい、との御連絡をいただいた。読みかけてみたのだが、いきなりQWERTY配列に対するガセネタが書かれていて、とても有料の部分まで読む気になれなかった。

キーボードのQWERTY配列は、タイプライターの機械式アームがぶつかって絡まるトラブルを減らすために、わざと非効率的に設計された。この特性はもはや現在のキーボードには無関係だが、人々はそんなことにはお構いなく、まだQWERTY配列のキーボードを使っている。

タイプライターに「アーム」という機構が導入されたのは、1893年発売の「Daugherty Typewriter」以降であり、現在のQWERTY配列が現れた頃(1882年)のアップストライク式タイプライターに「アーム」などという機構はない。…と書きかけて、もしや誤訳なのではないかと思い、原文の『Let’s make private data into a public good』(MIT Technology Review、2018年6月27日)の方も読んでみた。

The QWERTY keyboard layout was designed to be deliberately inefficient so that the mechanical keys of the typewriter would jam less frequently. That feature is no longer relevant, but it doesn’t matter—we’re still typing on QWERTY keyboards, because that’s what people are used to.

原文には「アーム」など出てこない。「the mechanical keys of the typewriter would jam」というアヤシゲなガセネタが書いてあるだけだ。つまり、おせっかいな訳者が「アーム」などという単語を導入して、完全な誤訳にしてしまった、ということだろう。ただ、アップストライク式タイプライターは、「keys」が「jam」ったりしないので、そもそも原文の内容も間違いだったりする。

Like the internal-combustion engine or the QWERTY keyboard, a company that establishes itself as the leader in a market achieves a dominance that becomes self-perpetuating almost automatically.

違う。現在のQWERTY配列を作ったWyckoff, Seamans & Benedict社は、確かにTypewriter Trust成立時点(1893年)では「the leader in a market」となったが、20世紀になった途端Underwood Typewriter社に追い抜かれている。そのUnderwood Typewriter社も、結局はIBMにトップの座を明け渡し、Olivettiに買収されてしまっている。少なくともQWERTY配列の歴史においては、「dominance」が「self-perpetuating」なんていう甘い話は無くて、後続企業にどんどん潰されていくのが現実だ。Mariana MazzucatoがQWERTY配列を例にしたいのなら、もう少しちゃんとQWERTY配列の歴史を調べてから書くべきだと思う。

13638572 journal
日本

yasuokaの日記: 「胱」「腥」「腟」は人名用漢字なのか 4

日記 by yasuoka

ネットサーフィンしていたところ、呉智英の『「暴走万葉仮名」の分析に計量社会学者は立ち上がるべき』(NEWSポストセブン、2018年7月2日)という、ワケのわからない記事に行き当たった。タイトルからして計量言語学と計量社会学を混同している上に、中身はもっとワケがわからない。

1951年、日本の戸籍に子の名前として記載できる漢字が定められた。当初は100文字に満たない漢字しかなかったが、徐々に増加、現在は800文字超ある。

「子の名に使える漢字」のことを言いたいのだろうが、1951年5月25日の時点だと、当用漢字表1850字、当用漢字字体表1850字、人名用漢字別表92字が「子の名に使える漢字」となっていた。ちなみに、2017年9月25日現在で2999字になってるんだけど、「現在は800文字超ある」って何の話だろう?

ところで、私には吉川のような計量社会学者にこそ調査研究してもらいたいテーマがある。十年以上前から、新聞や雑誌に何度か書いてきた「暴走万葉仮名」だ。漢字の無理読みで付けた子供の名前のことで、暴走族の「夜露死苦」や「仏恥義理」と同系のものなので、そう名付けた。「今鹿(なうしか)」「雅龍(がーる)」「一二三(どれみ)」あたりはまだしも、偏(へん)の肉月の意味も理解せず、月光の意味で使った「胱(あかり、膀胱だよ)」「腥(すたあ、なまぐさだぞ)」「腟(らいと、月光の射す寝室?)」なんてのもあるらしい。

「胱」も「腥」も「腟」も「子の名に使える漢字」ではないので、いくら計量社会学者が頑張ったところで、「子供の名前」における用例はほぼ皆無だと思う。あるいは「胱」と「腥」は韓国の人名用漢字なので、もしかしたら韓国で調査をおこなうという意味なのかもしれないが、その場合でも漢字の読みが「胱」は「광」、「腥」は「성」に限定されるので、どう考えても「あかり」や「すたあ」にならない。ましてや「腟」は、日本の人名用漢字でも韓国の人名用漢字でもないので、呉智英が吉川徹に何を立ち上がってほしいのか、正直さっぱりワケがわからない。

そんなワケで、私(安岡孝一)自身は計量社会学者ではなく、あくまで計量言語学者の一人なのだが、呉智英の記事に載せられて、今日の日記で、ちょっとだけ「立ち上がる」ことにした。この呉智英の記事は、常用漢字も人名用漢字も全く理解しておらず、単なる屑記事だ。こんな記事に載せられて「立ち上がる」私のような人間は、まあ、バカだと言わざるを得ないだろう。

13627321 journal
アメリカ合衆国

yasuokaの日記: 1877年3月のフランス向けレミントン・タイプライターのキー配列

日記 by yasuoka

『La Nature』のバックナンバーを読んでいたところ、1877年3月10日号(5º Année, No.197)にGaston Tissandierの『LA MACHINE A ÉCRIRE』という記事(pp.225-227)を見つけた。最初のページに、どーんと「Remington No.1」の図版があるのだが、キー配列がちょっと変だ。上段のアルファベットがQWERTVUIOP、その次の段がASDFGHJKLM、最下段がZCXYBNとなっているので、少なくともVとYが入れ替わっている。ただ、キーボード上にピリオドが見当たらないので、あるいは何かのミスかもしれない。さて、このキー配列、1891年10月のものとも違ってるんだけど、どう考えればいいかな…。

13619365 journal
アメリカ合衆国

yasuokaの日記: 1891年10月のフランス向けレミントン・タイプライターのキー配列

日記 by yasuoka

『Le Génie Civil』のバックナンバーを読んでいたところ、1891年10月24日号(Tome XIX, No.26)のpp.430-431に、「Les machines à écrire」と題するWyckoff, Seamans & Benedictからの小さな記事を見つけた。

Nous vous prions de bien vouloir insérer en même temps le schéma de notre clavier, dont la simplicité constitue un des principaux points de supériorité de la Remington sur les autres machines dites à écrire.

という文に続いて、当時のフランス向けレミントン・タイプライターのキー配列が掲載されているのだが、上段がAWERTYUIOP、中段がQSDFGHJKLM、下段がZXCVBNで、数字は最上段のシフト側にある。うーん、AZERTY配列になる以前のフランス向けキー配列かしら?

13618857 journal
アメリカ合衆国

yasuokaの日記: 1874年発売の「Sholes & Glidden Type-Writer」は、1872年の『Scientific American』に掲載可能か? 1

日記 by yasuoka

ネットサーフィンしていたところ、ねとらぼアンサーで『かつて“2より小さい数字が打てないキーボード”が存在した理由』(2018年6月9日)という妙な記事を見つけた。私(安岡孝一)の

オフィス機器としてのQWERTYキーボード(日本オフィス学会誌/安岡孝一氏)

を主要参考文献に引いているのだが、本文中では

「Sholes and Glidden typewriter」(1874年発売)

と書いていながら、図のキャプションには

左:「Sholes and Glidden typewriter」の写真、右:「Scientific American」誌(1872年)に掲載された、同タイプライターの絵

と書いてあるのだ。1874年4月発売の「Sholes & Glidden Type-Writer」の絵が、1872年8月10日の『Scientific American』に掲載されているわけで、どう考えても話がおかしい。

実のところ、これら2つのタイプライターは、全く異なるモデルだ。端的に言えば、1872年のモデルは文字キーの数が42だが、1874年のモデルはキー数が44に増えている。1872年のモデルは小机を改造して台座にしているが、1874年のモデルはミシン台である。そして、1872年のモデルは筐体が木製だが、1874年のモデルはネズミ鋳鉄である。

ただ、この記事の最も妙なところは、『かつて“2より小さい数字が打てないキーボード”が存在した理由』というタイトルなのに、本文中に「理由」が書かれていない点だろう。Sholesの「1869年10月18日」付けの手紙とか、見たことないのかしら?

13618074 journal
携帯電話

yasuokaの日記: J-PHONE SkyWalker絵文字とUnicode絵文字

日記 by yasuoka

私(安岡孝一)の一昨日の日記に関連して、J-PHONE SkyWalker絵文字と、現在のUnicode 11.0との対応表を作ってみた。顔文字(F997~F99A)のあたりの対応に、イマイチ自信がないのだが、とりあえず公開する。

  • F941「👦」U+1F466
  • F942「👧」U+1F467
  • F943「💋」U+1F48B
  • F944「👨」U+1F468
  • F945「👩」U+1F469
  • F946「👕」U+1F455
  • F947「👟」U+1F45F
  • F948「📷」U+1F4F7
  • F949「☎」U+260E
  • F94A「📱」U+1F4F1
  • F94B「📠」U+1F4E0
  • F94C「💻」U+1F4BB
  • F94D「👊」U+1F44A
  • F94E「👍」U+1F44D
  • F94F「☝」U+261D
  • F950「✊」U+270A
  • F951「✌」U+270C
  • F952「✋」U+270B
  • F953「🎿」U+1F3BF
  • F954「⛳」U+26F3
  • F955「🎾」U+1F3BE
  • F956「⚾」U+26BE
  • F957「🏄」U+1F3C4
  • F958「⚽」U+26BD
  • F959「🐟」U+1F41F
  • F95A「🐴」U+1F434
  • F95B「🚗」U+1F697
  • F95C「⛵」U+26F5
  • F95D「✈」U+2708
  • F95E「🚆」U+1F686
  • F95F「🚅」U+1F685
  • F960「❓」U+2753
  • F961「❢」U+2762
  • F962「♥」U+2665
  • F963「💔」U+1F494
  • F964「🕐」U+1F550
  • F965「🕑」U+1F551
  • F966「🕒」U+1F552
  • F967「🕓」U+1F553
  • F968「🕔」U+1F554
  • F969「🕕」U+1F555
  • F96A「🕖」U+1F556
  • F96B「🕗」U+1F557
  • F96C「🕘」U+1F558
  • F96D「🕙」U+1F559
  • F96E「🕚」U+1F55A
  • F96F「🕛」U+1F55B
  • F970「🌸」U+1F338
  • F971「🔱」U+1F531
  • F972「🌹」U+1F339
  • F973「🎄」U+1F384
  • F974「💍」U+1F48D
  • F975「💎」U+1F48E
  • F976「🏠」U+1F3E0
  • F977「⛪」U+26EA
  • F978「🏢」U+1F3E2
  • F979「🚉」U+1F689
  • F97A「⛽」U+26FD
  • F97B「🗻」U+1F5FB
  • F97C「🎤」U+1F3A4
  • F97D「🎥」U+1F3A5
  • F97E「♪」U+266A
  • F980「🔑」U+1F511
  • F981「🎷」U+1F3B7
  • F982「🎸」U+1F3B8
  • F983「🎺」U+1F3BA
  • F984「🍴」U+1F374
  • F985「🍸」U+1F378
  • F986「☕」U+2615
  • F987「🍰」U+1F370
  • F988「🍺」U+1F37A
  • F989「⛄」U+26C4
  • F98A「☁」U+2601
  • F98B「☀」U+2600
  • F98C「☔」U+2614
  • F98D「🌙」U+1F319
  • F98E「🌄」U+1F304
  • F98F「👼」U+1F47C
  • F990「🐱」U+1F431
  • F991「🐯」U+1F42F
  • F992「🐻」U+1F43B
  • F993「🐶」U+1F436
  • F994「🐭」U+1F42D
  • F995「🐳」U+1F433
  • F996「🐧」U+1F427
  • F997「☺」U+263A
  • F998「😄」U+1F604
  • F999「☹」U+2639
  • F99A「😢」U+1F622
  • F99B「💩」U+1F4A9

これらJ-PHONE SkyWalker絵文字は、私の知る限り、DP-211SW・DP-212・J-PE01・J-PE02などの機種では共通だったが、J-SH02ではカラー化されて、そちらがVodafoneに引き継がれたようである。当時の「SkyWalker対応機種」と「J-Sky対応機種」がどうなっていたのか、よければ確かめてみてほしい。

13617391 journal
日本

yasuokaの日記: 「⿸屁月」を含む神社

日記 by yasuoka

法人番号公表サイトを見ていたところ、宇陀市大宇陀嬉河原の「⿸屁月」神社(くずじんじゃ、法人番号3150005004202に行き当たった。この「⿸屁月」は、どう見ても「九頭」の合字には見えないので、あるいは「屑」の異体字の可能性が疑われる。ただし、『汎用電子情報交換環境整備プログラム成果報告書』別冊には、私(安岡孝一)が探す限り、この漢字が見当たらない。一方で、登記ねっと外字コードは0U1027FBとなっているようだ。さて、どうしたものかしら。

13616266 journal
携帯電話

yasuokaの日記: Re: Unicodeの絵文字のルーツ 7

日記 by yasuoka

私(安岡孝一)の2017年12月21日2018年3月2日の日記の読者から、シャルコ・アンナの『外国人が目を丸くした日本の「絵文字」の豊かさ』(BEST T!MES、2018年6月6日)を読んでみてほしい、との御連絡をいただいた。読んでみたのだが、絵文字の歴史に関して書かれた以下の部分が、どうも気になった。

1993年に図2のスマイリーフェイスを含めて、100個以上の絵文字がUnicode1.1の「その他の記号」というブロックに登録されると、ワードの「記号と特殊文字」から選んで打てるようになりました。

Unicodeの「Miscellaneous Dingbats」に、☺☻☹を含む106字が収録されたのは、1991年10月のUnicode 1.0だったりする。でも、この「ワード」って、何のことだろう? この時点でのMS-Wordは、まだUnicode対応しきれてなかったはずだけど?

携帯電話のメッセージに絵文字が使えるようになったのは、1999年に日本のNTTドコモによって176種類の絵文字のセットがリリースされたことが始まりです。

携帯電話の電子メール絵文字は、私の知る限り、1997年11月のJ-PHONE DP-211SWにまで遡る。また、DDIポケットのKX-PH21Fは1998年3月なので、これもドコモの「iモード」よりは古い。これに加え、1999年2月に「iモード」でリリースされた絵文字は、166種類であって176種類ではない。

ちなみに、この『外国人が目を丸くした日本の「絵文字」の豊かさ』という記事は、『絵文字進化論』という連載記事の第1回らしい。まあ、第2回以降でちゃんと訂正が入るのを、私としては期待するのだけど、さて、どうなるかしら。

13615469 journal
中国

yasuokaの日記: Universal Dependenciesにおける「主述述語文」の問題

日記 by yasuoka

私(安岡孝一)の昨日の日記に関連して、じゃあ現代中国語における主述述語文(主謂謂語句)はどうなってるんだろう、と思い、少し調べてみた。結論から言うと、現代中国語Universal Dependenciesは、主述述語文を真っ向から扱っていない。たとえば「幼貓睡眠時間極長」という文であれば、「睡眠時間」が「極長」の主語であり、さらに「幼貓」が「睡眠時間極長」の主語である、という考え方になるはずだが、現時点でのgoogleによるannotationの結果は、以下の通りである。

1 幼貓 幼貓 NOUN NN _ 3 nmod _ SpaceAfter=No
2 睡眠 睡眠 NOUN NN _ 3 nmod _ SpaceAfter=No
3 時間 時間 NOUN NN _ 4 nsubj _ SpaceAfter=No
4 極長 極長 ADJ JJ _ 0 root _ SpaceAfter=No

このannotationは、端的に言うなら「幼貓の睡眠時間は極長」であって、「幼貓は睡眠時間が極長」ではない。つまり、この「幼貓睡眠時間極長」という文を、主述述語文として扱うのを避けているわけだ。うーん、それはそれで困ったな…

13614527 journal
地球

yasuokaの日記: Universal Dependenciesにおける「二重主語」の問題

日記 by yasuoka

5月22日の日記に続いて、「是民受之也」をもう少し考えてみた。現時点のUniversal Dependenciesでは、「受」からnsubjを2本出して、それぞれ「民」と「是」に突き刺すしか無いように思える。

1 是 是 PRON n,代名詞,指示,* _ 3 nsubj _ SpaceAfter=No
2 民 民 NOUN n,名詞,人,人 _ 3 nsubj _ SpaceAfter=No
3 受 受 VERB v,動詞,行為,得失 _ 0 root _ SpaceAfter=No
4 之 之 PRON n,代名詞,人称,止格 _ 3 obj _ SpaceAfter=No
5 也 也 PART p,助詞,句末,* _ 3 discourse:sp _ SpaceAfter=No

これに対し、Universal Dependenciesの少し古いドキュメントでは、nsubj:copの導入が検討されていたようだ。たとえば「The main thing is that the device works」という英文では、「works」にrootを突き刺した上で、「thing ←nsubj:cop─ works ─nsubj→ device」とすることが検討されたようである。しかしながら、現時点のドキュメントでは、「is」にrootを突き刺して、「thing ←nsubj─ is ─ccomp→ works ─nsubj→ device」としている。ヒドイ。

ちなみにチェコ語では、コピュラ文での主語の矢印の向きを逆転するという大技が使われている。たとえば「Faktem je, že ona je moje matka」という文では、「Faktem」にrootを突き刺して、「Faktem ─csubj→ matka ─nsubj→ ona」としているようだ。一方、『Universal Dependencies Version 2 for Japanese』の日本語(長単位)では、この手の文はdislocatedで対応している。たとえば「象は鼻が長い」という文では、「長い」にrootを突き刺して、「象は ←dislocated─ 長い ─nsubj→ 鼻が」とするやり方である。その一方で、アラビア語は(実は私(安岡孝一)自身はイマイチ読めないのだけど)、「二重主語」だろうと何だろうと、2本でも3本でもnsubj使いまくっているようだ。うーん、全然Universalじゃないんだけど、さて、古典中国語(漢文)では、どれにするのがいいんだろう?

typodupeerror

ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ

読み込み中...