All Projects → RabbearSu → Japanese-Words

RabbearSu / Japanese-Words

Licence: other
整理日语N2单词(新标准日本语初级和中级)

Programming Languages

python
139335 projects - #7 most used programming language

Projects that are alternatives of or similar to Japanese-Words

japanese-word-handler
Better Japanese word handling on Visual Studio Code.
Stars: ✭ 32 (-21.95%)
Mutual labels:  japanese, japanese-characters
KanjiRecognitionDictionary
Perfect for those who forgets kanji pronunciation
Stars: ✭ 14 (-65.85%)
Mutual labels:  japanese, japanese-study
wanikani-userscripts
Userscripts for the WaniKani.com website
Stars: ✭ 16 (-60.98%)
Mutual labels:  japanese, japanese-study
japanese-pitch-accent-resources
Trying to consolidate japanese phonetic, and in particular pitch accent resources into one list
Stars: ✭ 64 (+56.1%)
Mutual labels:  japanese, japanese-study
Nihonoari-App
A little and minimalist Japanese Kana training
Stars: ✭ 66 (+60.98%)
Mutual labels:  japanese, japanese-characters
kotoba
A Discord bot for helping with learning Japanese.
Stars: ✭ 118 (+187.8%)
Mutual labels:  japanese, japanese-study
kanji-web-app
Angular.js kanji web application
Stars: ✭ 45 (+9.76%)
Mutual labels:  japanese, japanese-study
kuzushiji-recognition
Kuzushiji Recognition Kaggle 2019. Build a DL model to transcribe ancient Kuzushiji into contemporary Japanese characters. Opening the door to a thousand years of Japanese culture.
Stars: ✭ 16 (-60.98%)
Mutual labels:  japanese
Hibi
[No Active Development] An Android app for learning Japanese by keeping a journal.
Stars: ✭ 37 (-9.76%)
Mutual labels:  japanese
cl-skkserv
Common LispによるSKK辞書サーバーとその拡張
Stars: ✭ 22 (-46.34%)
Mutual labels:  japanese
ReaperJPN-Phroneris
製品版REAPER日本語化パッチ(森)
Stars: ✭ 41 (+0%)
Mutual labels:  japanese
Jotoba
A free online, self-hostable, multilang Japanese dictionary.
Stars: ✭ 87 (+112.2%)
Mutual labels:  japanese
kanji
Haskell suite for determining what 級 (level) of the 漢字検定 (national Kanji exam) a given Kanji belongs to.
Stars: ✭ 19 (-53.66%)
Mutual labels:  japanese
limelight
A php Japanese language text analyzer and parser.
Stars: ✭ 76 (+85.37%)
Mutual labels:  japanese
analyze-desumasu-dearu
文の敬体(ですます調)、常体(である調)を解析するJavaScriptライブラリ
Stars: ✭ 15 (-63.41%)
Mutual labels:  japanese
akka-doc-ja
Akka Japanese Documentation
Stars: ✭ 25 (-39.02%)
Mutual labels:  japanese
gazou
Japanese OCR for Linux & Windows
Stars: ✭ 32 (-21.95%)
Mutual labels:  japanese
KWDLC
Kyoto University Web Document Leads Corpus
Stars: ✭ 64 (+56.1%)
Mutual labels:  japanese
YuzuMarker
🍋 [WIP] Manga Translation Tool
Stars: ✭ 76 (+85.37%)
Mutual labels:  japanese
kanji poster
Poster of 2200 jōyō and WaniKani kanji
Stars: ✭ 19 (-53.66%)
Mutual labels:  japanese

日语单词整理

Motivation

在学习日语的过程中,背单词是一个绕不去的砍。

对于不同的语言,单词的特点也不相同。对日语而言,有以下几个特点:

  • 汉字可以通过音读记忆
  • 同一个汉字可能对应不同的音读
  • 同一个音读可能对应不同的汉字

在我背单词的过程中,发现一个很有趣也很普遍的问题,在经过一段时间的 记忆后,看到汉字我可以回忆起假名,不用太费功夫。但是当我尝试看假名去回忆汉字时,却屡屡受挫。

通过看假名回忆汉字,是为了训练听力,因为你在听听力时,只能听到假名

Target

为了达到我们的目的,看到假名就能回忆起对应的日文和中文意思,首先需要进行分类。

我认为分类记忆会强化记忆,所以我会把不同的假名发音分类,在该类别下是该发音对应的假名和组词。 以下是一个例子:

假名 日语 组词
こう 高校
天候
効果
幸運
講演

RoadMap

1. Read Excel

使用pandas的表格处理功能,我们可以读取excel中的行列,并将读取所有的单词的

  • 假名
  • 日文
  • 汉字意思

所以get_words_list.py的输出为一个word_list.

技术细节:每个词条用Dict表示,分别为{'假名':, '日文':, '意思':},所有词条装在一个list

2. 分类

构建一个词汇表类,类的数据成员为希望得到的各个类别,初始化为空。
例如: self.kou = {'こう': []} # こう} ,每个数据成员都是一个Dict,其中key为字段,value为包含该字段的词汇的列表。

该词条表类有一个classify函数,输入为一个word_list,该函数遍历所有词条,假如该词条包含某个字段,则对应的数据成员添加该词条。

3. 生成Dataframe

得到每个字段所包含的词条后,需要整合。
创建一个pandas dataframe,如以下形式:

假名 日文 意思 类型
こう
こうそう 高層 高层 名词
...
せい
せいぞう 製造 制造,生产 名词
...

排除专有名词

4. 输出到excel

dataframe输出到excel文件。

5. 样品

我已经处理了生成的excel的文件,进行了校对和字体调整,并生成了PDF文件,可以在example里找到。

如果您有好的修改意见,或者发现了一些bug,欢迎提issue!
如果您有解决办法,也欢迎fork并pull!

最後の最後に, 如果该项目对您有帮助,欢迎分享并star!
ありがとうございます!

Note that the project description data, including the texts, logos, images, and/or trademarks, for each open source project belongs to its rightful owner. If you wish to add or remove any projects, please contact us at [email protected].