diff options
author | Alex Auvolat <alex@adnab.me> | 2023-10-18 21:59:16 +0200 |
---|---|---|
committer | Alex Auvolat <alex@adnab.me> | 2023-10-18 21:59:16 +0200 |
commit | 2a919c1f028d891744d37ad45664986b6cba4a5d (patch) | |
tree | cd231964696421f56b843bde109a193107c0382b | |
parent | fab4731ad5a4ca26beb1a342ba85eec92014c04b (diff) | |
download | datagengo-2a919c1f028d891744d37ad45664986b6cba4a5d.tar.gz datagengo-2a919c1f028d891744d37ad45664986b6cba4a5d.zip |
re-allow more diversity in examples
-rw-r--r-- | data/batches.json | 567 | ||||
-rw-r--r-- | src/main.rs | 4 |
2 files changed, 535 insertions, 36 deletions
diff --git a/data/batches.json b/data/batches.json index 9f3fb40..565016e 100644 --- a/data/batches.json +++ b/data/batches.json @@ -16078,6 +16078,13 @@ "chars": "上木犬詰追" }, { + "ja": "行方不明だった漁船が無事帰港した。", + "en": "The fishing boat that had been missing returned to its port safely.", + "expl": "行方不明 だ{だった} 漁船 が 無事[02] 帰港~ 為る(する){した}", + "id": "ID=241140_173330", + "chars": "不事帰方明港漁無船行" + }, + { "ja": "光の速度は毎秒約18万6千マイルである。", "en": "The light travels at about 186,000 miles a second.", "expl": "光 の 速度 は 毎秒~ 約 万(まん)[01] 千 哩{マイル} である", @@ -19662,6 +19669,13 @@ "chars": "員条玉皆社科言金長" }, { + "ja": "日本は兵器にあまりお金を使うべきではない。", + "en": "Japan should not spend much money on weapons.", + "expl": "日本 は 兵器 に 余り{あまり} 御(お){お} 金を使う べきではない", + "id": "ID=281602_122401", + "chars": "使兵器日本金" + }, + { "ja": "小麦粉は1ポンド単位で売られる。", "en": "Flour is sold by the pound.", "expl": "小麦粉 は ポンド 単位[01] で(#2028980) 売る{売られる}", @@ -30955,6 +30969,13 @@ ], "extra_examples": [ { + "ja": "ついに反逆者は捕らえられ、拘置所に入れられた。", + "en": "The rebel was ultimately captured and confined to jail.", + "expl": "遂に[01]{ついに} 反逆者 は 捕らえる[01]{捕らえられ}~ 拘置所~ に 入れる{入れられた}", + "id": "ID=39883_202649", + "chars": "入反所拘捕置者逆" + }, + { "ja": "運転免許証を持っていると、この仕事には有利だ。", "en": "Having a driver's license is an advantage for this job.", "expl": "運転免許証 を 持つ{持っている} と 此の{この} 仕事[01] には 有利 だ", @@ -30990,6 +31011,13 @@ "chars": "全君定拘束決諸部" }, { + "ja": "彼は鳥が頭上を飛んでいくのを眺めるのが好きです。", + "en": "He likes to watch the birds fly above his head.", + "expl": "彼(かれ)[01] は 鳥[01] が 頭上 を[03] 飛ぶ[01]{飛んで} 行く{いく} の を 眺める の が 好き(すき) です", + "id": "ID=301656_102038", + "chars": "上好彼眺頭飛鳥" + }, + { "ja": "よい食べ物と十分な睡眠は健康にとって絶対に必要だ。", "en": "Good food and enough sleep are absolutely necessary to good health.", "expl": "良い{よい} 食べ物 と 十分(じゅうぶん)[01]{十分な} 睡眠 は 健康 に取って{にとって} 絶対に 必要[01] だ", @@ -31011,6 +31039,13 @@ "chars": "幸才持殊特生者能" }, { + "ja": "それはわが国の産業の発展を妨げている。", + "en": "It interferes with our industrial development.", + "expl": "其れ[01]{それ} は 我が国{わが国} の 産業 の 発展 を 妨げる{妨げている}", + "id": "ID=42593_205349", + "chars": "国妨展業産発" + }, + { "ja": "神が愛する人には飼い犬から子豚が生まれる。", "en": "Whom God loves, his bitch brings forth pigs.", "expl": "神(かみ) が 愛する 人(ひと) には 飼い犬 から 子豚~ が 生まれる", @@ -31018,6 +31053,13 @@ "chars": "人子愛犬生神豚飼" }, { + "ja": "観光客は町中飲み歩いてどんちゃん騒ぎをした。", + "en": "The tourists painted the whole town red.", + "expl": "観光客 は 町中(まちじゅう) 飲む[01]{飲み} 歩く{歩いて} どんちゃん騒ぎ~ を 為る(する){した}", + "id": "ID=20918_183795", + "chars": "中光客歩町観飲騒" + }, + { "ja": "この壮大な大聖堂の建立は中世にまでさかのぼる。", "en": "This magnificent cathedral dates back to the Middle Ages.", "expl": "此の{この} 壮大{壮大な} 大聖堂~ の 建立 は 中世~ に 迄{まで} 遡る{さかのぼる}", @@ -31039,6 +31081,34 @@ "chars": "亡人妨察犯警逃" }, { + "ja": "山頂からの眺めは壮観だった。", + "en": "The view from the mountain top was spectacular.", + "expl": "山頂 から の 眺め は 壮観 だ{だった}", + "id": "ID=245097_169389", + "chars": "壮山眺観頂" + }, + { + "ja": "下痢止めです。", + "en": "Here's some medicine for diarrhea.", + "expl": "下痢~ 止め(どめ)~ です", + "id": "ID=25350_188211", + "chars": "下止痢" + }, + { + "ja": "古代では疫病でたくさんの人が死んだ。", + "en": "In ancient times, plagues killed many people.", + "expl": "古代 で(#2028980) は 疫病 で(#2028980) 沢山{たくさん} の 人(ひと) が 死ぬ{死んだ}", + "id": "ID=239873_174596", + "chars": "人代古死疫病" + }, + { + "ja": "特殊な才能を与えられた動物もいる。", + "en": "Some animals are endowed with special gifts.", + "expl": "特殊{特殊な} 才能 を 与える[01]{与えられた} 動物 も 居る(いる){いる}", + "id": "ID=280534_123463", + "chars": "与動才殊物特能" + }, + { "ja": "君はあまり字句に拘泥しすぎるよ。", "en": "You are too much letter-bound.", "expl": "君(きみ)[01] は 余り{あまり} 字句~ に 拘泥~ 為る(する){し} 過ぎる(すぎる){すぎる} よ[01]", @@ -31095,6 +31165,20 @@ "chars": "典壮大婚室式王祭結" }, { + "ja": "妹の誕生日に真珠のネックレスを贈った。", + "en": "I gave my sister a pearl necklace on her birthday.", + "expl": "妹 の 誕生日 に 真珠 の ネックレス を 贈る{贈った}", + "id": "ID=322312_81403", + "chars": "妹日珠生真誕贈" + }, + { + "ja": "被告は無罪放免になった。", + "en": "The accused was absolved from the crime.", + "expl": "被告 は 無罪放免~ になる[01]{になった}", + "id": "ID=317893_85819", + "chars": "免告放無罪被" + }, + { "ja": "兄は先月浦和にマイホームを建てた。", "en": "My brother had a house built in Urawa last month.", "expl": "兄(あに) は 先月 に マイホーム を 建てる{建てた}", @@ -31109,6 +31193,13 @@ "chars": "大宝工師珠真石細込" }, { + "ja": "豚の前に真珠を投げ与えるな。", + "en": "Do not cast pearls before swine.", + "expl": "豚~ の 前(まえ) に 真珠 を 投げる[01]{投げ} 与える[01] な[01]", + "id": "ID=280735_123263", + "chars": "与前投珠真豚" + }, + { "ja": "大形航空機は大きな騒音公害をもたらした。", "en": "Large planes brought about large amounts of sound pollution.", "expl": "大型(おおがた){大形} 航空機 は 大きな(おおきな) 騒音公害 を 齎す(もたらす)[02]{もたらした}", @@ -31128,6 +31219,13 @@ "expl": "此の{この} 栓 は 瓶(びん){びん} に 合う{合わない}", "id": "ID=58109_220788", "chars": "合栓" + }, + { + "ja": "たいてい、自動車事故は睡眠不足から生じている。", + "en": "In most cases, car accidents result from lack of sleep.", + "expl": "大抵{たいてい} 自動車事故 は 睡眠不足 から 生じる{生じている}", + "id": "ID=41211_203968", + "chars": "不事動故生眠睡自足車" } ] }, @@ -31409,6 +31507,13 @@ ], "extra_examples": [ { + "ja": "原爆は広島全体を破壊した。", + "en": "The atomic bomb destroyed the entire city of Hiroshima.", + "expl": "原爆 は 全体 を 破壊[01] 為る(する){した}", + "id": "ID=239478_174989", + "chars": "体全原壊島広爆破" + }, + { "ja": "杉本夫人はいつもこぎれいな着物を着ている。", "en": "Mrs. Sugimoto always wears neat clothes.", "expl": "夫人 は 何時も[01]{いつも} 小奇麗{こぎれいな} 着物[02] を 着る[01]{着ている}", @@ -31514,6 +31619,13 @@ "chars": "万円家彼新概用算築費" }, { + "ja": "医者は概して子供の養育の訓練を受けていない。", + "en": "Doctors are not as a rule trained in child rearing.", + "expl": "医者 は 概して 子供 の 養育~ の 訓練 を 受ける{受けていない}", + "id": "ID=28000_190840", + "chars": "供医受子概練者育訓養" + }, + { "ja": "薪割りを好む人が多いのは理解できる。", "en": "I know why there are so many people who love chopping wood.", "expl": "薪割り[02]~ を 好む 人(ひと) が 多い の は 理解 出来る{できる}", @@ -31661,6 +31773,13 @@ "chars": "取古在壊映最現町画館" }, { + "ja": "私は叙事詩よりも叙情詩の方が好きだ。", + "en": "I like lyric better than epic.", + "expl": "私(わたし)[01] は 叙事詩 よりも 叙情詩~ の 方(ほう) が 好き(すき) だ", + "id": "ID=258602_155934", + "chars": "事叙好情方私詩" + }, + { "ja": "田舎に住んでから、彼の健康は徐々に快方に向かった。", "en": "His health gradually changed for the better after he went to live in the countryside.", "expl": "田舎[01] に 住む{住んで} から 彼(かれ)[01]{彼の} 健康 は 徐々に 快方に向かう{快方に向かった}", @@ -33896,6 +34015,13 @@ "chars": "上対援支殿申礼貴重" }, { + "ja": "姉は注目すべき英語の進歩を遂げた。", + "en": "My sister has made remarkable progress in English.", + "expl": "姉(あね) は 注目 す可き{すべき} 英語 の 進歩 を 遂げる{遂げた}", + "id": "ID=245596_168894", + "chars": "姉歩注目英語進遂" + }, + { "ja": "椎間板ヘルニアをわずらっています。", "en": "I have a slipped disc.", "expl": "椎間板ヘルニア を 患う{わずらっています}", @@ -33938,6 +34064,13 @@ "chars": "値周均増大幅平振数波減" }, { + "ja": "よく結膜炎を起こします。", + "en": "I often get conjunctivitis.", + "expl": "良く[02]{よく} 結膜炎~ を 起こす{起こします}", + "id": "ID=29950_192784", + "chars": "炎結膜起" + }, + { "ja": "国務長官は対外関係を統括する。", "en": "The Secretary of State administers foreign affairs.", "expl": "国務長官~ は 対外~ 関係 を 統括[02]~ 為る(する){する}", @@ -33966,6 +34099,13 @@ "chars": "会住化彼持文民的誇達都" }, { + "ja": "彼のよい振る舞いに最も強い印象を受けた。", + "en": "I was most impressed by his good behavior.", + "expl": "彼(かれ)[01]{彼の} 良い{よい} 振る舞い に 最も 強い(つよい) 印象 を 受ける{受けた}", + "id": "ID=285452_118212", + "chars": "印受強彼振最舞象" + }, + { "ja": "30階建の超高層ビルが突然爆発炎上した。", "en": "All of a sudden, the thirty-story skyscraper went up in flames.", "expl": "階建て{階建} の 超高層ビル~ が 突然 爆発[01] 炎上[01] 為る(する){した}", @@ -33994,6 +34134,13 @@ "chars": "上下地女室少放縛置" }, { + "ja": "掲示板を荒らす人の精神状態がわかりません。", + "en": "I just don't understand what goes through the minds of people who troll forums.", + "expl": "掲示板 を[01] 荒らす[03]~ 人(ひと) の[01]{の} 精神状態 が 分かる{わかりません}", + "id": "ID=328682_75037", + "chars": "人態掲板状示神精荒" + }, + { "ja": "政府は国内産業振興の方策を講じた。", "en": "The government has taken measures to promote domestic industry.", "expl": "政府 は 国内産業~ 振興 の 方策~ を 講じる[01]{講じた}", @@ -34008,6 +34155,13 @@ "chars": "剛彼手投球荒速" }, { + "ja": "選挙の結果は夕刊に載るでしょう。", + "en": "The results of the election will appear in the evening paper.", + "expl": "選挙 の 結果 は 夕刊~ に 載る[02]{載る} でしょう[01]", + "id": "ID=273536_141036", + "chars": "刊夕挙果結載選" + }, + { "ja": "試験に落ちた学生の名前は掲示板に張り出された。", "en": "The names of the students who failed in the examination were posted on the bulletin board.", "expl": "試験 に 落ちる[08]{落ちた} 学生(がくせい) の 名前 は 掲示板 に 張り出す{張り出された}", @@ -34078,6 +34232,20 @@ "chars": "号始小新月来説載連" }, { + "ja": "我々の計画の成功には、君の援助がどうしても必要だ。", + "en": "Your help is vital to the success of our plan.", + "expl": "我々 の 計画 の 成功 には 君(きみ)[01]{君の} 援助 が 如何しても{どうしても} 必要[01] だ", + "id": "ID=23026_185894", + "chars": "功助君必成我援画要計" + }, + { + "ja": "彼は操縦士としての自分の技術を大変誇りにしている。", + "en": "He is very proud of his skill as a pilot.", + "expl": "彼(かれ)[01] は 操縦士 として の 自分[01] の 技術 を 大変 誇り に 為る(する){している}", + "id": "ID=300821_102873", + "chars": "分士変大彼技操縦自術誇" + }, + { "ja": "科学は今世紀になって急速な進歩を遂げた。", "en": "Science has made rapid progress in this century.", "expl": "科学 は 今世紀~ になる{になって} 急速{急速な} 進歩 を 遂げる{遂げた}", @@ -34357,6 +34525,13 @@ "chars": "僕切受女彼望申諾込" }, { + "ja": "彼は街頭で買った絵を額縁に入れた。", + "en": "He framed the picture he had bought on the street.", + "expl": "彼(かれ)[01] は 街頭 で(#2028980) 買う{買った} 絵 を 額縁[01]~ に 入れる{入れた}", + "id": "ID=294771_108919", + "chars": "入彼絵縁街買頭額" + }, + { "ja": "彼は過去の苦しい生活を黙想した。", "en": "He meditated on his past life of suffering.", "expl": "彼(かれ)[01] は 過去 の 苦しい[02]~ 生活 を 黙想~ 為る(する){した}", @@ -34399,13 +34574,6 @@ "chars": "不価安急政果格結財金騰" }, { - "ja": "男の子が縁石の方へカートをゆっくり押しやっている。", - "en": "A boy is taking his sweet time pushing the cart toward the curb.", - "expl": "男の子(おとこのこ) が 縁石~ の 方(ほう) へ カート(#1036360)[01] を ゆっくり 押しやる{押しやっている}~", - "id": "ID=276828_127261", - "chars": "子押方男石縁" - }, - { "ja": "新しい貿易区域の計画はまだ実施の段階にありません。", "en": "Plans for a new trade zone are still on the drawing board.", "expl": "新しい 貿易 区域[01] の 計画 は 未だ[02]{まだ} 実施 の 段階(だんかい)[01] に 有る{ありません}", @@ -34483,13 +34651,6 @@ "chars": "不住厳宅家暴賃足騰" }, { - "ja": "飲み物はヤシの実の殻に入れてあった。", - "en": "The drinks were served in coconut shells.", - "expl": "飲み物 は 椰子{ヤシ}~ の 実(み)[01] の 殻(から)~ に 入れる{入れて} 有る{あった}", - "id": "ID=27113_189957", - "chars": "入実殻物飲" - }, - { "ja": "これは亡くなった父の肖像画です。", "en": "This is a portrait of my late father.", "expl": "此れ[01]{これ} は 亡くなる{亡くなった} 父 の 肖像画 です", @@ -34539,6 +34700,13 @@ "chars": "仕文様章解釈" }, { + "ja": "もう・・・タバコの吸殻まで散らばってるし。", + "en": "Sheesh, you've even got cigarette butts scattered around.", + "expl": "もう 煙草{タバコ} の[01]{の} 吸殻~ 迄{まで} 散らばる{散らばってる} し", + "id": "ID=328339_75380", + "chars": "吸散殻" + }, + { "ja": "登山道に空き缶やゴミを捨てるのはやめてほしい。", "en": "I wish people would stop throwing away empty cans and other trash along the path up the mountain.", "expl": "登山道~ に 空き缶 や 塵(ごみ){ゴミ} を 捨てる の は 止める(やめる){やめて} 欲しい[02]{ほしい}", @@ -35712,6 +35880,13 @@ "chars": "勉合強彼心格熱試陰験" }, { + "ja": "彼は結婚披露宴でスピーチをした。", + "en": "He made a speech at the wedding feast.", + "expl": "彼(かれ)[01] は 結婚披露宴 で(#2028980) スピーチ を 為る(する){した}", + "id": "ID=295898_107786", + "chars": "婚宴彼披結露" + }, + { "ja": "塩水の方が淡水よりも浮力が大きい。", "en": "Salt water is more buoyant than fresh water.", "expl": "塩水 の 方(ほう) が 淡水 よりも 浮力~ が 大きい", @@ -40518,6 +40693,13 @@ ], "extra_examples": [ { + "ja": "聴衆は、退屈した表情で、劇場から出ていった。", + "en": "The audience walked out of the theater, looking bored.", + "expl": "聴衆 は 退屈 為る(する){した} 表情 で(#2028980) 劇場 から 出て行く{出ていった}", + "id": "ID=277921_126071", + "chars": "出劇場屈情聴衆表退" + }, + { "ja": "鉛筆1本と紙を何枚か下さい。", "en": "Please give me a pencil and some sheets of paper.", "expl": "鉛筆 本(ほん)[03] と 紙(かみ) を 何(なん)[04] 枚(まい)[01] か 下さい", @@ -40546,6 +40728,20 @@ "chars": "供子損時無砲鉄" }, { + "ja": "猫は小鳥に忍び寄った。", + "en": "The cat crept toward the bird.", + "expl": "猫(ねこ)[01] は 小鳥 に 忍び寄る{忍び寄った}", + "id": "ID=282059_121944", + "chars": "寄小忍猫鳥" + }, + { + "ja": "彼は浴槽に水を出しっぱなしにしている。", + "en": "He has the water running in the bathtub.", + "expl": "彼(かれ)[01] は 浴槽 に 水(みず) を 出しっぱなし に 為る(する){している}", + "id": "ID=304533_99166", + "chars": "出彼槽水浴" + }, + { "ja": "熱帯の太陽は容赦なくぎらぎら照り付けた。", "en": "The tropical sun glared down relentlessly.", "expl": "熱帯 の 太陽 は 容赦なく~ ぎらぎら 照りつける{照り付けた}", @@ -40637,6 +40833,13 @@ "chars": "切堪忍慢我緒袋" }, { + "ja": "会社の収益は飛躍的に増加した。", + "en": "The company's profits soared.", + "expl": "会社 の 収益 は 飛躍的{飛躍的に}~ 増加 為る(する){した}", + "id": "ID=22399_185271", + "chars": "会加収増的益社躍飛" + }, + { "ja": "市は困窮者に毛布を支給した。", "en": "The city supplied the needy with blankets.", "expl": "市(し) は 困窮者 に 毛布 を 支給 為る(する){した}", @@ -40644,6 +40847,13 @@ "chars": "困市布支毛窮給者" }, { + "ja": "殺人の有罪宣告を受け、彼は終身刑を科せられた。", + "en": "Having been convicted of murder, he was sentenced to life imprisonment.", + "expl": "殺人 の 有罪 宣告 を 受ける{受け} 彼(かれ)[01] は 終身刑 を 科する{科せられた}", + "id": "ID=244935_169552", + "chars": "人刑受告宣彼有殺科終罪身" + }, + { "ja": "遅かれ早かれ捕虜達は釈放されるだろう。", "en": "Sooner or later, the hostages will be released.", "expl": "遅かれ早かれ 捕虜 達 は 釈放 為れる{される} だろう", @@ -40714,6 +40924,13 @@ "chars": "亜佐好子方知私紀" }, { + "ja": "候補者たちは減税法案をめぐって応酬しました。", + "en": "Candidates traded blows over the proposed tax cut.", + "expl": "候補者 達{たち} は 減税 法案 を巡って{をめぐって}~ 応酬[01]~ 為る(する){しました}", + "id": "ID=240375_174095", + "chars": "候応案法減税者補酬" + }, + { "ja": "氷のような冷気が車内に忍び込んできた。", "en": "An icy chill stole into the car.", "expl": "氷(こおり)[01] の[01]{の} 様な{ような} 冷気~ が 車内~ に 忍び込む{忍び込んで} 来る(くる){きた}", @@ -43732,6 +43949,13 @@ "chars": "太子沈西貞陽" }, { + "ja": "あの少年の名前は和田慎太郎です。", + "en": "That boy's name is Shintaro Wada.", + "expl": "彼の(あの){あの} 少年 の 名前[01] は です", + "id": "ID=68213_230846", + "chars": "前名和太少年慎田郎" + }, + { "ja": "私は慎太郎君は英語を上手に話すと思います。", "en": "I think that Shintaro speaks English well.", "expl": "私(わたし)[01] は 君(きみ) は 英語 を 上手(じょうず)[01]{上手に} 話す と 思う{思います}", @@ -43781,13 +44005,6 @@ "chars": "不人働則外戸症的眠苦規" }, { - "ja": "急いては事を仕損じるよ。もう少々慎重に。", - "en": "Be more careful. Rushing through things is going to ruin your work.", - "expl": "急く{急いて} は 事(こと) を 仕損じる~ よ もう 少々 慎重{慎重に}", - "id": "ID=19728_182586", - "chars": "事仕少急慎損重" - }, - { "ja": "彼女は衣料品を買うときは注意深く選択する。", "en": "She makes careful choices when she buys clothes.", "expl": "彼女[01] は 衣料 品[01] を 買う[01] 時(とき){とき} は 注意深く 選択 為る(する){する}", @@ -45770,6 +45987,13 @@ "expl": "芝刈り機~ が 簡素{簡素な}~ 作り(つくり) の 荷車~ に 積む{積んである}", "id": "ID=265279_149279", "chars": "作刈機積簡素芝荷車" + }, + { + "ja": "その摩天楼はまわりの他の建物の上方にそびえていた。", + "en": "The skyscraper rose above the other buildings around.", + "expl": "其の[01]{その} 摩天楼~ は 回り[02]{まわり} の 他(ほか){他の} 建物 の 上方(じょうほう)~ に 聳える{そびえていた}", + "id": "ID=43841_206592", + "chars": "上他天建摩方楼物" } ] }, @@ -48895,6 +49119,13 @@ "chars": "償取受多彼怪我賠金額" }, { + "ja": "口は体の死刑執行人であり医者である。", + "en": "The mouth is the executioner and the doctor of the body.", + "expl": "口(くち)[05] は 体(からだ) の 死刑執行~ 人(ひと) である{であり} 医者 である", + "id": "ID=240549_173921", + "chars": "人体刑医口執死者行" + }, + { "ja": "トラファルガー広場にはネルソン提督の彫像がある。", "en": "There is a statue of Nelson in Trafalgar Square.", "expl": "広場[01] には ネルソン~ 提督~ の 彫像~ が[01] 有る{ある}", @@ -49021,13 +49252,6 @@ "chars": "候挙果立結者胆落補選" }, { - "ja": "警察は殺人罪で沙知代を告発した。", - "en": "The police charged Sachiyo with the murder.", - "expl": "警察 は 殺人罪 で(#2028980) を 告発 為る(する){した}", - "id": "ID=238281_176184", - "chars": "人代告察殺沙発知罪警" - }, - { "ja": "政府は作物が受けた被害に対して農民に補償した。", "en": "The government compensated the farmers for the damage to the crops.", "expl": "政府 は 作物(さくもつ) が 受ける{受けた} 被害 に対して 農民 に 補償 為る(する){した}", @@ -49698,6 +49922,27 @@ "chars": "人何手故派目苦鷹" }, { + "ja": "伊藤さんという方がお会いしたいそうです。", + "en": "A person named Itoh wants to meet you.", + "expl": "さん と言う{という} 方(かた)[01] が 会う[01]{お会い} したい そうだ[02]{そうです}", + "id": "ID=465075_191152", + "chars": "伊会方藤" + }, + { + "ja": "その知らせは伊藤君が私に伝えてくれた。", + "en": "The news was told to me by Ito.", + "expl": "其の[01]{その} 知らせ は 君(きみ) が 私(わたし)[01] に 伝える{伝えて} 呉れる{くれた}", + "id": "ID=45218_207961", + "chars": "伊伝君知私藤" + }, + { + "ja": "私も伊藤さんにお目にかかれて光栄です。", + "en": "I'm glad to meet you, too, Mr Ito.", + "expl": "私(わたし)[01] も さん に お目に掛かる[01]{お目にかかれて} 光栄 です", + "id": "ID=262351_152199", + "chars": "伊光栄目私藤" + }, + { "ja": "私は伊丹十三監督の全ての映画が好きです。", "en": "I like all films that Juzo Itami directs.", "expl": "私(わたし)[01] は 十 三 監督 の 全て{全ての} 映画 が 好き(すき) です", @@ -49726,6 +49971,20 @@ "chars": "子少智本漫画白貸面" }, { + "ja": "伊藤さんはたいへん学識のある人です。", + "en": "Mr Ito is a highly educated man.", + "expl": "さん は 大変{たいへん} 学識 の[03]{の} 有る{ある} 人(ひと) です", + "id": "ID=28310_191150", + "chars": "人伊学藤識" + }, + { + "ja": "伊藤さんにアポ取っておいてくれる?", + "en": "Will you make an appointment with Mr Ito?", + "expl": "さん に アポ 取る(とる){取って} 置く{おいて} 呉れる{くれる}", + "id": "ID=28311_191151", + "chars": "伊取藤" + }, + { "ja": "農夫が畑に種を蒔いている。", "en": "The farmer is scattering seeds over the field.", "expl": "農夫 が 畑 に 種を蒔く{種を蒔いている}", @@ -49733,6 +49992,13 @@ "chars": "夫畑種蒔農" }, { + "ja": "飛行機は時刻通り伊丹空港に着いた。", + "en": "The plane put down at Itami Airport on time.", + "expl": "飛行機 は 時刻 通り(どおり)[01] 空港 に 着く(つく)[01]{着いた}", + "id": "ID=318075_85638", + "chars": "丹伊刻時機港着空行通飛" + }, + { "ja": "ハレー彗星は、80年ごとに1度やってくる。", "en": "Halley's Comet comes round once every eighty years.", "expl": "ハレー彗星 は 年毎に{年ごとに} 一度{1度} やって来る{やってくる}", @@ -49747,6 +50013,27 @@ "chars": "持目鋭鷹" }, { + "ja": "伊藤先生は生徒達を一生懸命勉強させた。", + "en": "Miss Ito made her students work hard.", + "expl": "先生(せんせい)[01] は 生徒 達 を 一生懸命 勉強[01] 為せる{させた}", + "id": "ID=28302_191143", + "chars": "一伊先勉命強徒懸生藤達" + }, + { + "ja": "新鮮な伊勢エビを見たら、食欲がわいた。", + "en": "The sight of fresh lobster gave me an appetite.", + "expl": "新鮮{新鮮な} 伊勢海老{伊勢エビ} を 見る{見たら} 食欲 が 湧く[03]{わいた}", + "id": "ID=269321_145242", + "chars": "伊勢新欲見食鮮" + }, + { + "ja": "伊藤氏といえば、息子さんはどうなりましたか。", + "en": "Talking of Mr Ito, what has become of his son?", + "expl": "氏(し)[01] と言えば[01]{といえば} 息子[01] さん は 如何(どう){どう} 成る{なりました} か", + "id": "ID=28308_191148", + "chars": "伊子息氏藤" + }, + { "ja": "農民が穀物の種を蒔いた。", "en": "The peasant scattered the seeds of grain.", "expl": "農民 が 穀物 の 種を蒔く{種を蒔いた}", @@ -49796,6 +50083,13 @@ "chars": "分半大鳥鷹" }, { + "ja": "伊藤教授は言語学の研究のためアメリカへ行った。", + "en": "Professor Ito went to the United States for the purpose of studying linguistics.", + "expl": "教授 は 言語学 の 研究 の 為(ため){ため} 亜米利加{アメリカ} へ 行く[01]{行った}", + "id": "ID=28309_191149", + "chars": "伊学授教研究藤行言語" + }, + { "ja": "ハレー彗星は、2061年に戻ってくる。", "en": "Halley's Comet will come back in 2061.", "expl": "ハレー彗星~ は 年(ねん) に 戻って来る{戻ってくる}", @@ -49810,6 +50104,13 @@ "chars": "元友子気綾達" }, { + "ja": "伊勢エビが大好きなのですが、非常に高いのです。", + "en": "I am very fond of lobsters, but they are very, very expensive.", + "expl": "伊勢海老{伊勢エビ}~ が 大好き なのだ{なのです} が[03] 非常に 高い[02] のです", + "id": "ID=28314_191154", + "chars": "伊勢大好常非高" + }, + { "ja": "美智子はまるで北極に行って来たような口ぶりだ。", "en": "Michiko talks as if she had been to the Arctic herself.", "expl": "は 丸で{まるで} 北極 に 行って来る{行って来た} 様な{ような} 口ぶり だ", @@ -49824,6 +50125,13 @@ "chars": "佐子日智本来藤" }, { + "ja": "蒔かぬ種は生えない。", + "en": "You must sow before you can reap.", + "expl": "撒く{蒔かぬ} 種(たね)[01]~ は 生える[01]{生えない}", + "id": "ID=264882_149676", + "chars": "生種蒔" + }, + { "ja": "ジョニーは46年間りんごの種子を蒔き付けた。", "en": "Johnny kept planting apple seeds for 46 years.", "expl": "は 年間 林檎{りんご} の 種子 を 蒔き付ける{蒔き付けた}~", @@ -49838,6 +50146,20 @@ "chars": "一家磯行野" }, { + "ja": "伊藤氏は事務所で熱く感じたのでネクタイを緩めた。", + "en": "Mr Ito loosened his tie because he felt hot in his office.", + "expl": "氏(し)[01] は 事務所 で(#2028980) 熱い{熱く} 感じる{感じた} ので ネクタイ を[01] 緩める{緩めた}", + "id": "ID=28307_191147", + "chars": "事伊務感所氏熱緩藤" + }, + { + "ja": "急がなくちゃだめだよ。伊藤先生が出席をとるよ。", + "en": "We've got to hurry. Mr Itoh will call the roll.", + "expl": "急(きゅう) が 無くちゃ{なくちゃ} 駄目{だめ} だ よ 先生(せんせい)[02] が 出席 を 取る{とる} よ[01]", + "id": "ID=19694_182551", + "chars": "伊先出席急生藤" + }, + { "ja": "伊藤太郎は有罪と判決された。", "en": "Taro Ito was found guilty.", "expl": "は 有罪 と 判決 為れる{された}", @@ -50863,13 +51185,6 @@ "chars": "事全原因完故謎" }, { - "ja": "諸君、ちょっと御挨拶申し上げます。", - "en": "Gentlemen, allow me to say a few words in greeting.", - "expl": "諸君[02]~ 一寸(ちょっと){ちょっと} 御(ご) 挨拶[02] 申し上げる[01]{申し上げます}", - "id": "ID=267164_147396", - "chars": "上君御拶挨申諸" - }, - { "ja": "その子供は、つまずいて転んで膝を突いた。", "en": "The kid stumbled and fell to his knees.", "expl": "其の[01]{その} 子供 は 躓く{つまずいて} 転ぶ{転んで} 膝を突く{膝を突いた}~", @@ -50975,6 +51290,13 @@ "chars": "与乞全持私部金食" }, { + "ja": "挨拶は礼儀作法の根本である。", + "en": "Greetings are the basis of good manners.", + "expl": "挨拶[01] は 礼儀作法 の 根本(こんぽん)[02]~ である", + "id": "ID=28679_191517", + "chars": "作儀拶挨本根法礼" + }, + { "ja": "兄の膝は怪我で手術が必要かもしれない。", "en": "My brother may have to be operated on for the knee injury.", "expl": "兄(あに) の 膝 は 怪我[01] で(#2028980) 手術 が 必要 かも知れない{かもしれない}", @@ -53600,6 +53922,13 @@ "chars": "力努少岸年海無着辿駄" }, { + "ja": "この林檎は腐っている。", + "en": "This apple is bad.", + "expl": "此の{この} 林檎 は 腐る{腐っている}", + "id": "ID=56499_219183", + "chars": "林檎腐" + }, + { "ja": "マスコミが彼の婚約の噂を嗅ぎつけ早速駆けつけた。", "en": "The media got wind of a rumor about his engagement and came quickly.", "expl": "マスコミ が 彼(かれ) の 婚約 の 噂 を 嗅ぎつける{嗅ぎつけ} 早速 駆けつける{駆けつけた}", @@ -53607,6 +53936,27 @@ "chars": "嗅噂婚彼早約速駆" }, { + "ja": "その少年は狼が来ると言った。", + "en": "The boy said a wolf would come.", + "expl": "其の[01]{その} 少年 は 狼~ が 来る(くる)[01] と 言う{言った}", + "id": "ID=46275_209015", + "chars": "少年来狼言" + }, + { + "ja": "7月10日より札幌支店を開設いたします。", + "en": "On July 10, we will open our Sapporo branch.", + "expl": "七月{7月} 十日[01]{10日} より[03]~ 札幌~ 支店~ を 開設~ 致す{いたします}", + "id": "ID=72384_235007", + "chars": "幌店支日月札設開" + }, + { + "ja": "その企業が倒産するという噂が広まっている。", + "en": "There's a rumor in the air that the firm is going into bankruptcy.", + "expl": "其の[01]{その} 企業 が 倒産 為る(する){する} と言う{という} 噂 が 広まる{広まっている}", + "id": "ID=48849_211572", + "chars": "企倒噂広業産" + }, + { "ja": "あのグリーンの縞のシャツ、今洗濯してるん?", "en": "Is that green striped shirt in the wash?", "expl": "彼の(あの){あの} グリーン の 縞~ の シャツ 今(いま) 洗濯 為る(する){してる} ん[03]", @@ -53614,6 +53964,13 @@ "chars": "今洗濯縞" }, { + "ja": "すっぱい木においしい林檎はならない。", + "en": "No good apple on a sour stock.", + "expl": "酸っぱい{すっぱい}~ 木(き) に 美味しい{おいしい} 林檎 は ならない", + "id": "ID=51937_214645", + "chars": "木林檎" + }, + { "ja": "私達は東京から札幌まで飛行機に乗りました。", "en": "We took a plane from Tokyo to Sapporo.", "expl": "私たち{私達} は 東京 から 札幌 迄{まで} 飛行機 に 乗る[01]{乗りました}", @@ -53635,6 +53992,20 @@ "chars": "匹殺狼羊" }, { + "ja": "札幌は、日本で5番目に大きな都市だ。", + "en": "Sapporo is the fifth largest city in Japan.", + "expl": "札幌 は 日本 で(#2028980) 番目 に 大きな 都市 だ", + "id": "ID=244929_169557", + "chars": "大市幌日本札番目都" + }, + { + "ja": "戦場は死んだ人々と瀕死の人々でいっぱいだ。", + "en": "The battlefield was full of the dead and the dying.", + "expl": "戦場 は 死ぬ{死んだ} 人々(ひとびと) と 瀕死{瀕死の} 人々(ひとびと) で(#2028980) 一杯{いっぱい} だ", + "id": "ID=273256_141315", + "chars": "人場戦死瀕" + }, + { "ja": "狼と犬の区別がつきますか。", "en": "Can you tell wolves from dogs?", "expl": "狼 と 犬[01] の 区別がつく{区別がつきます} か", @@ -53677,6 +54048,20 @@ "chars": "初山最着誰辿頂" }, { + "ja": "その林檎はまだ熟していないよ。", + "en": "The apple is not yet ripe.", + "expl": "其の[01]{その} 林檎 は 未だ[02]{まだ} 熟す(じゅくす){熟していない} よ", + "id": "ID=43455_206209", + "chars": "林檎熟" + }, + { + "ja": "この鳥は絶滅の危機に瀕している。", + "en": "This bird is in danger of dying out.", + "expl": "此の{この} 鳥[01] は 絶滅 の 危機 に 瀕する{瀕している}", + "id": "ID=57819_220497", + "chars": "危機滅瀕絶鳥" + }, + { "ja": "多くの弱い生物種が絶滅の危機に瀕している。", "en": "Many fragile species are on the verge of extinction.", "expl": "多く の 弱い 生物(せいぶつ) 種(しゅ)[02] が 絶滅 の 危機 に 瀕する{瀕している}", @@ -53684,6 +54069,13 @@ "chars": "危多弱機滅瀕物生種絶" }, { + "ja": "彼女の振る舞いがいろんな噂の原因になった。", + "en": "Her behavior gave rise to rumors.", + "expl": "彼女[01]{彼女の} 振る舞い が 色んな{いろんな} 噂 の 原因 になる[01]{になった}", + "id": "ID=309298_94264", + "chars": "原噂因女彼振舞" + }, + { "ja": "マユコは私の林檎を一口食べた。", "en": "Mayuko took a bite of my apple.", "expl": "は 私(わたし)[01]{私の} 林檎 を 一口[01] 食べる{食べた}", @@ -53691,6 +54083,20 @@ "chars": "一口林檎私食" }, { + "ja": "瀕死の患者の家族についてはどうでしょうか。", + "en": "What about the family of the dying patient?", + "expl": "瀕死{瀕死の} 患者 の 家族 に就いて{について} は 如何(どう){どう} でしょうか", + "id": "ID=318497_85216", + "chars": "家患族死瀕者" + }, + { + "ja": "ある日彼女は森で狼に出会った。", + "en": "One day she met a wolf in the woods.", + "expl": "ある日 彼女[01] は 森[01] で(#2028980) 狼 に 出会う{出会った}", + "id": "ID=67150_229788", + "chars": "会出女彼日森狼" + }, + { "ja": "水増し決算の噂で株価は上がりませんでした。", "en": "The stock got creamed when they got wind of the dilution.", "expl": "水増し 決算 の 噂 で(#2028980) 株価 は 上がる{上がりませんでした}", @@ -53705,6 +54111,13 @@ "chars": "分割半取林檎" }, { + "ja": "その噂は結局事実であることが解った。", + "en": "The rumor turned out to be true.", + "expl": "其の[01]{その} 噂 は 結局 事実 である 事(こと){こと} が 分かる{解った}", + "id": "ID=405710_212307", + "chars": "事噂実局結解" + }, + { "ja": "たばこをお吸いの方は後部座席にお坐り下さい。", "en": "Smokers are asked to occupy the rear seats.", "expl": "煙草を吸う{たばこをお吸い} の 方(ほう) は 後部座席~ に 座る[01]{お坐り} 下さい", @@ -53719,6 +54132,13 @@ "chars": "区域店彼町賑" }, { + "ja": "母を見送りに札幌駅に行ってきたところです。", + "en": "I have just been to Sapporo Station to see my mother off.", + "expl": "母(はは) を 見送り に 札幌 駅 に 行く{行って} 来る(くる){きた} 所(ところ){ところ} です", + "id": "ID=320783_82933", + "chars": "幌札母行見送駅" + }, + { "ja": "次の一節はある有名な寓話から引用したものです。", "en": "The following passage was quoted from a well-known fable.", "expl": "次(つぎ)[01]{次の} 一節(いっせつ) は 有る{ある} 有名[01]{有名な} 寓話 から 引用 為る(する){した} 物(もの){もの} です", @@ -53747,6 +54167,13 @@ "chars": "人値其打柄産財" }, { + "ja": "今まであなたが辿った道を見つめなおしてみましょう。", + "en": "Let's look at the path that you've walked so far.", + "expl": "今まで 貴方(あなた)[01]{あなた} が 辿る[01]{辿った} 道(みち) を 見つめなおす{見つめなおして}~ 見る(みる){みましょう}", + "id": "ID=71354_233981", + "chars": "今見辿道" + }, + { "ja": "総選挙がありそうだと言う噂が流れていた。", "en": "A general election was in the air.", "expl": "総選挙~ が[01] 有る{あり} そう[01] だ と 言う 噂 が 流れる[04]{流れていた}", @@ -55555,6 +55982,20 @@ "chars": "今山登蘇阿" }, { + "ja": "己の欲せざる所は人に施す勿れ。", + "en": "Do to others as you would have others do to you.", + "expl": "己(おのれ)[01] の 欲する{欲せ} ざる~ 所(ところ) は 人(ひと) に 施す 勿れ", + "id": "ID=239912_174557", + "chars": "人勿己所施欲" + }, + { + "ja": "彼は些細なことで腹をたてる傾向がある。", + "en": "He tends to get angry over trifles.", + "expl": "彼(かれ)[01] は 些細{些細な} 事(こと){こと} で(#2028980) 腹を立てる{腹をたてる} 傾向 が[01] 有る{ある}", + "id": "ID=296673_107013", + "chars": "些傾向彼細腹" + }, + { "ja": "敵はその砦を占領した。", "en": "The enemy occupied the fort.", "expl": "敵(てき)[01] は 其の[01]{その} 砦 を 占領 為る(する){した}", @@ -55562,6 +56003,13 @@ "chars": "占敵砦領" }, { + "ja": "諺に、覆水盆に返らずと言う。", + "en": "The proverb says that what is done cannot be undone.", + "expl": "諺 に 覆水盆に返らず~ と 言う", + "id": "ID=239802_174667", + "chars": "水盆覆言諺返" + }, + { "ja": "不思議な感じが蘇ってきた。", "en": "The strange feeling came back.", "expl": "不思議{不思議な} 感じ が 蘇る[01]{蘇って} 来る(くる){きた}", @@ -55569,6 +56017,20 @@ "chars": "不思感蘇議" }, { + "ja": "ペート先生は百人の人間の前で喋るのが怖い気がした。", + "en": "Miss Pate felt timid about making a speech before a hundred people.", + "expl": "先生(せんせい)[02] は 百 人(にん) の 人間(にんげん)[01] の 前(まえ) で(#2028980) 喋る の が 怖い 気がする{気がした}", + "id": "ID=34021_196842", + "chars": "人先前喋怖気生百間" + }, + { + "ja": "私が今日あるのはおじのお蔭である。", + "en": "I owe what I am today to my uncle.", + "expl": "私(わたし)[01] が 今日 有る{ある} の は 叔父{おじ} の お陰{お蔭} である", + "id": "ID=250296_156966", + "chars": "今日私蔭" + }, + { "ja": "この記念碑は祖国に命を捧げた兵士を祭っている。", "en": "This monument is dedicated to the soldiers who gave their lives to their country.", "expl": "此の{この} 記念碑~ は 祖国~ に 命を捧げる{命を捧げた}~ 兵士 を 祭る[01]{祭っている}~", @@ -55583,6 +56045,13 @@ "chars": "喧嘩次見野集馬" }, { + "ja": "私は来週ニューヨークに行く筈になっている。", + "en": "I'm supposed to go to New York next week.", + "expl": "私(わたし)[01] は 来週 紐育{ニューヨーク} に 行く 筈 になる[01]{になっている}", + "id": "ID=262139_152411", + "chars": "来私筈行週" + }, + { "ja": "横には喧嘩状態の妻が眠っている。", "en": "To my side, my wife, who I'm presently at odds with, lies sleeping.", "expl": "横[04] には 喧嘩 状態 の 妻(#1294330)[01] が 眠る[01]{眠っている}", @@ -55646,6 +56115,13 @@ "chars": "優先初勿最束約論謝" }, { + "ja": "老人は杖をついていた。", + "en": "The old man walked with a stick.", + "expl": "老人 は 杖(つえ) を 付く(つく){ついていた}", + "id": "ID=326449_77270", + "chars": "人杖老" + }, + { "ja": "パーティーには食べ物や飲物が豊富に揃えて有った。", "en": "There was food and drink in abundance at the party.", "expl": "パーティー には 食べ物 や 飲み物{飲物} が 豊富{豊富に} 揃える{揃えて} 有る{有った}", @@ -55681,6 +56157,13 @@ "chars": "全安撃攻砦" }, { + "ja": "その夫婦は喧嘩をしたが、すぐに仲直りをした。", + "en": "The couple quarreled, but soon made up.", + "expl": "其の(その)[01]{その} 夫婦(ふうふ) は 喧嘩 を 為る(する){した} が 直ぐに{すぐに} 仲直り を 為る(する){した}", + "id": "ID=318735_84977", + "chars": "仲喧嘩夫婦直" + }, + { "ja": "コンサートの最中に喋るのは無作法である。", "en": "To talk during a concert is rude.", "expl": "コンサート の 最中(さいちゅう)~ に 喋る の は 無作法 である", @@ -55730,11 +56213,25 @@ "chars": "出映母汝空親顔" }, { + "ja": "市はその将軍に敬意を表して記念碑を捧げた。", + "en": "The city dedicated a monument in honor of the general.", + "expl": "市(し) は 其の[01]{その} 将軍 に 敬意 を 表す(あらわす){表して} 記念碑 を 捧げる{捧げた}", + "id": "ID=246120_168372", + "chars": "将市念意捧敬碑表記軍" + }, + { "ja": "道具としての実需がないから品揃えに深みがでない。", "en": "There's no demand for them as tools, so the product line-up is poor.", "expl": "道具 として の 実需~ が 無い{ない} から 品揃え~ に 深み が 出る{でない}", "id": "ID=329466_74254", "chars": "具品実揃深道需" + }, + { + "ja": "そのアパートはビクトリア朝風の家具を揃えてあった。", + "en": "The apartment was furnished in the Victorian style.", + "expl": "其の[01]{その} アパート[02] は ビクトリア 朝風(ちょうふう){朝風の}~ 家具 を[01] 揃える{揃えて} 有る{あった}", + "id": "ID=50691_213405", + "chars": "具家揃朝風" } ] }, diff --git a/src/main.rs b/src/main.rs index 04a9e80..598f147 100644 --- a/src/main.rs +++ b/src/main.rs @@ -1025,6 +1025,7 @@ fn add_extra_examples(all_batches: &mut [Batch], examples: &[Example]) { .map(|x| x.chars.chars().iter().copied()) .flatten(), ); + let mut in_batch_extra = Charset::default(); while batch.extra_examples.len() < 40 { let best = candidates .iter() @@ -1051,10 +1052,11 @@ fn add_extra_examples(all_batches: &mut [Batch], examples: &[Example]) { }) .max_by_key(|(_, _, w1, w2, w3)| (-(*w1 as i64), *w2, -(*w3 * 100_000f32) as i64)); if let Some((i, ex, w1, w2, w3)) = best { - if w2 > 0 || batch.extra_examples.len() < 20 { + if ex.chars.diff(&in_batch_extra).len() > 0 || batch.extra_examples.len() < 20 { println!("{}\t{}\t{:.2}\t{} - {}", w1, w2, w3, ex.ja, ex.en); batch.extra_examples.push(ex.clone()); in_batch = in_batch.union(&ex.chars); + in_batch_extra = in_batch_extra.union(&ex.chars); for c in ex.chars.chars().iter() { *char_seen_count.entry(*c).or_default() += 1; if batch.chars.chars().contains(c) { |