Visualizing kanji data

Hey! I was very curious to see some data quantified and visualized. For example, I’d love to know the number of times こう is the reading for various characters, compared with every other reading. I’m imagining a bar graph or something with a huge stack of こうs, しょうs, and せいs on the left.

I’d also like to see something like how frequently certain kanji are used, even just limited to the vocab on WK. Like, 気, 人, and 力, for example, get used in a lot of different vocabulary words. Some only have use in a single vocab.

Also, would it be possible to see the most commonly messed up kanji amongst all users? That would also be quite interesting.

3 Likes

mmmh there’s this work here:

but it’s by mora not by reading. am curious as well. let’s see if someone replies.

1 Like

Wha? I’m confused by this. What about, like, 会社 (かいしゃ) or 神社 (じんじゃ)? I suppose they’re third mora here… but still final, not initial.

EDIT:
医者 (いしゃ), what about that?

EDIT 2:
OK it’s occurring to me the quoted analysis was perhaps about mora within individual kanji readings, and not about mora within words.

1 Like

tx for answering your questions. i can’t really help but please have this

for no reason at all…

4 Likes

I can’t really read that but it looks like **** on a wall.

And I think I see the word “smear”. Which is, I suppose, appropriate.

bruh

it’s on my fingers too…

it obviously says smeared ink tsssskkkk…

2 Likes

Here is some data on all of the current accepted readings of the wanikani kanji:

こう : 59
しょう : 56
か : 40
かん : 40
し : 37
き : 35
そう : 32
とう : 31
せい : 31
けん : 27
せん : 26
さい : 25
しん : 25
きょう : 24
けい : 24
ちょう : 23
ひ : 23
ほう : 23
い : 23
ぼう : 23
じょう : 21
てい : 21
りょう : 20
はん : 20
こ : 20
たい : 19
しゅう : 19
きゅう : 18
ゆう : 18
かい : 18
ふ : 18
せき : 16
よう : 16
かく : 16
じ : 15
ご : 14
さ : 13
げん : 13
は : 13
そ : 13
たん : 13
えん : 12
こん : 12
しゃ : 12
れい : 12
ぎ : 12
すい : 11
しゅ : 11
どう : 11
ち : 11
きん : 11
はい : 11
じゅう : 10
さん : 10
と : 10
す : 10
りゅう : 10
きょ : 10
ろう : 10
ぞう : 10
えい : 10
じゅん : 10
じん : 9
ちゅう : 9
はく : 9
せつ : 9
がい : 9
へい : 9
ひょう : 9
だん : 9
ゆ : 9
さつ : 9
しょ : 9
お : 9
く : 8
おう : 8
ふん : 8
ぶ : 8
や : 8
そく : 8
さく : 8
こく : 8
しょく : 8
ふく : 8
たく : 8
じょ : 7
てん : 7
た : 7
ばん : 7
もう : 7
だ : 7
めい : 7
ばい : 7
ほ : 7
しつ : 7
つ : 7
り : 7
いん : 7
よ : 7
れん : 7
だい : 6
ぼく : 6
う : 6
がん : 6
ごう : 6
ねん : 6
み : 6
けつ : 6
が : 6
へん : 6
やく : 6
えき : 6
ろ : 6
とく : 6
りん : 6
てき : 6
ぼ : 6
ばく : 6
に : 5
にん : 5
ど : 5
もん : 5
びょう : 5
みょう : 5
け : 5
なん : 5
わ : 5
ぎょう : 5
ぜん : 5
かつ : 5
え : 5
じゅ : 5
の : 5
び : 5
のう : 5
てつ : 5
ぞく : 5
しゅく : 5
ざい : 5
めん : 5
よく : 5
そん : 5
む : 5
しゃく : 5
ちん : 5
め : 4
まん : 4
せ : 4
まい : 4
らい : 4
がく : 4
おん : 4
らく : 4
な : 4
びん : 4
りょ : 4
ざん : 4
れつ : 4
しき : 4
ひん : 4
あい : 4
るい : 4
らん : 4
かた : 4
しゅん : 4
あ : 4
いつ : 3
にゅう : 3
はち : 3
げ : 3
ぶん : 3
もく : 3
ほん : 3
りつ : 3
あん : 3
きょく : 3
ひつ : 3
まつ : 3
ぎょ : 3
くん : 3
ば : 3
すう : 3
でん : 3
きゃく : 3
べん : 3
る : 3
あつ : 3
ふう : 3
おく : 3
げい : 3
ぐん : 3
ちく : 3
も : 3
ばつ : 3
ちょ : 3
げき : 3
とつ : 3
くつ : 3
えつ : 3
ま : 3
ら : 3
ぼん : 3
しち : 2
かわ : 2
ろく : 2
じつ : 2
ひろ : 2
はな : 2
ごん : 2
さと : 2
あめ : 2
あま : 2
くさ : 2
ゆい : 2
みん : 2
なつ : 2
じゃく : 2
かみ : 2
つう : 2
あさ : 2
こた : 2
くも : 2
ぐ : 2
ぶつ : 2
もつ : 2
かしら : 2
べつ : 2
いく : 2
あく : 2
はし : 2
ぎん : 2
そつ : 2
じゅつ : 2
はる : 2
どく : 2
きつ : 2
れき : 2
とん : 2
ぜい : 2
ぬ : 2
わく : 2
ごく : 2
ぎゃく : 2
かさ : 2
みつ : 2
じゅく : 2
うら : 2
どん : 2
まく : 2
しか : 2
だく : 2
とら : 2
しば : 2
すん : 2
ひめ : 2
すみ : 2
つい : 2
じょく : 2
ぐう : 2
ちつ : 2
ずい : 2
もち : 2
いち : 1
りょく : 1
りき : 1
また : 1
まる : 1
て : 1
にち : 1
げつ : 1
がつ : 1
いぬ : 1
しゅつ : 1
たま : 1
ない : 1
ぎゅう : 1
ちち : 1
ふゆ : 1
ほく : 1
はは : 1
かあ : 1
こおり : 1
さら : 1
ひゃく : 1
たけ : 1
いと : 1
みみ : 1
むし : 1
むら : 1
あか : 1
べい : 1
はね : 1
にく : 1
いろ : 1
なに : 1
ず : 1
こえ : 1
で : 1
たに : 1
むぎ : 1
はやし : 1
くう : 1
ちょく : 1
じき : 1
おも : 1
ちゃ : 1
くび : 1
ゆき : 1
もり : 1
およ : 1
はつ : 1
かる : 1
かろ : 1
うん : 1
よこ : 1
あたま : 1
かお : 1
なか : 1
むかし : 1
しま : 1
さむ : 1
ちゃく : 1
がっ : 1
のま : 1
さま : 1
みどり : 1
ねつ : 1
かがみ : 1
みな : 1
みんな : 1
こつ : 1
てら : 1
いわ : 1
かえ : 1
ひる : 1
あき : 1
さか : 1
ねこ : 1
はこ : 1
わら : 1
ぞん : 1
がわ : 1
そば : 1
しお : 1
うめ : 1
ぜ : 1
そこ : 1
たつ : 1
ざ : 1
むね : 1
わか : 1
した : 1
しり : 1
あな : 1
ろん : 1
おか : 1
だつ : 1
ね : 1
みや : 1
ふじ : 1
いき : 1
わり : 1
さき : 1
しろ : 1
ちが : 1
とど : 1
せま : 1
せば : 1
うで : 1
こし : 1
かぶ : 1
わた : 1
あせ : 1
ぶた : 1
なや : 1
ぜつ : 1
はま : 1
りゃく : 1
むすめ : 1
づ : 1
まくら : 1
うわ : 1
でい : 1
みゃく : 1
りく : 1
さくら : 1
ざつ : 1
たまご : 1
つくえ : 1
まど : 1
なっ : 1
どんぶり : 1
いも : 1
たて : 1
つめ : 1
つま : 1
かめ : 1
かれ : 1
かの : 1
はじ : 1
すぎ : 1
くま : 1
なべ : 1
はら : 1
はば : 1
おき : 1
もど : 1
わん : 1
かか : 1
いだ : 1
よろ : 1
あつか : 1
ゆる : 1
わい : 1
ひか : 1
かべ : 1
うず : 1
うば : 1
いね : 1
いな : 1
ほり : 1
うかが : 1
ほたる : 1
ちゅ : 1
はたけ : 1
はた : 1
じく : 1
がら : 1
つな : 1
あら : 1
ふくろ : 1
だれ : 1
かき : 1
ぬま : 1
めつ : 1
こと : 1
きち : 1
やいば : 1
もも : 1
なぞ : 1
さむらい : 1
おれ : 1
なし : 1
ひき : 1
あらし : 1
たな : 1
はだ : 1
ふね : 1
ふな : 1
かたまり : 1
ころ : 1
ごろ : 1
なり : 1
のろ : 1
みが : 1
よめ : 1
たき : 1
かけ : 1
はと : 1
わが : 1
ねい : 1
さる : 1
かぎ : 1
くせ : 1
きく : 1
きり : 1
くちびる : 1
さわ : 1
にじ : 1
へび : 1
やみ : 1
すき : 1
しも : 1
おど : 1
わき : 1
こま : 1
つる : 1
くわ : 1
じゃ : 1
うつ : 1
わに : 1
かに : 1
よど : 1
はさ : 1
ふつ : 1
えり : 1
つか : 1
いばら : 1
ぼつ : 1
れふ : 1
なんじ : 1
すなわ : 1
あや : 1
はやぶさ : 1
すけ : 1
にしき : 1
こい : 1
あけぼの : 1
あおい : 1
ちゃん : 1
おろし : 1
おろ : 1
すく : 1
かま : 1
くき : 1
あんず : 1
あかね : 1
しおり : 1
とち : 1
にょう : 1
これ : 1
うやうや : 1
やす : 1
つぼ : 1
おつ : 1
からす : 1
かえで : 1
かな : 1
あかつき : 1
しの : 1
みず : 1
しるし : 1
すが : 1
とうげ : 1
めす : 1
こら : 1
みさき : 1
あこが : 1
あずさ : 1
うた : 1
ます : 1
むこ : 1
ようや : 1
やや : 1
きつね : 1
にお : 1
うそ : 1
くし : 1
うわさ : 1
ひざ : 1
しゃべ : 1
さけ : 1
しゃけ : 1
あて : 1
いちご : 1
かじ : 1
おおかみ : 1
いじ : 1
いら : 1
さいな : 1
へ : 1
へき : 1
かゆ : 1
ぺーじ : 1

7 Likes

There are a few too many different readings for me to plot them all (a lot of kunyomi only appear once or twice anyway), but here’s a graph of the top 30 readings. Most of them are common onyomi readings like こう. I used all readings listed on WK instead of just the accepted answer on the kanji page, as this roughly includes readings taught later in vocab. It might be a slight overestimate of readings taught though, but it should be close enough :grin:

Here’s a graph of the top 30 kanji by occurrence in WK vocab. As expected most of them are common low-level kanji that can be used to create compounds like 人 or 不.

We don’t have access to this data regrettably, so that one is impossible without the staff giving us a graph.

7 Likes

I’m honoured :durtle_love:

3 Likes

The analysis was for single kanji, while your ‘example’ is for a vocab item of 2 kanji; 社 alone adheres to the finding :

the combos (with little や、ゆ、よ)only occur singly / in first position, never in second…

alone kanji is 社(やしろorしゃ)
in to first position this kanji for to: 社員(しゃいん),社会(しゃかい)

Because these were approximations of chinese readings, and those are one syllable long always