From 2a919c1f028d891744d37ad45664986b6cba4a5d Mon Sep 17 00:00:00 2001 From: Alex Auvolat Date: Wed, 18 Oct 2023 21:59:16 +0200 Subject: re-allow more diversity in examples --- data/batches.json | 567 ++++++++++++++++++++++++++++++++++++++++++++++++++---- src/main.rs | 4 +- 2 files changed, 535 insertions(+), 36 deletions(-) diff --git a/data/batches.json b/data/batches.json index 9f3fb40..565016e 100644 --- a/data/batches.json +++ b/data/batches.json @@ -16077,6 +16077,13 @@ "id": "ID=239175_175291", "chars": "上木犬詰追" }, + { + "ja": "行方不明だった漁船が無事帰港した。", + "en": "The fishing boat that had been missing returned to its port safely.", + "expl": "行方不明 だ{だった} 漁船 が 無事[02] 帰港~ 為る(する){した}", + "id": "ID=241140_173330", + "chars": "不事帰方明港漁無船行" + }, { "ja": "光の速度は毎秒約18万6千マイルである。", "en": "The light travels at about 186,000 miles a second.", @@ -19661,6 +19668,13 @@ "id": "ID=265327_149231", "chars": "員条玉皆社科言金長" }, + { + "ja": "日本は兵器にあまりお金を使うべきではない。", + "en": "Japan should not spend much money on weapons.", + "expl": "日本 は 兵器 に 余り{あまり} 御(お){お} 金を使う べきではない", + "id": "ID=281602_122401", + "chars": "使兵器日本金" + }, { "ja": "小麦粉は1ポンド単位で売られる。", "en": "Flour is sold by the pound.", @@ -30954,6 +30968,13 @@ } ], "extra_examples": [ + { + "ja": "ついに反逆者は捕らえられ、拘置所に入れられた。", + "en": "The rebel was ultimately captured and confined to jail.", + "expl": "遂に[01]{ついに} 反逆者 は 捕らえる[01]{捕らえられ}~ 拘置所~ に 入れる{入れられた}", + "id": "ID=39883_202649", + "chars": "入反所拘捕置者逆" + }, { "ja": "運転免許証を持っていると、この仕事には有利だ。", "en": "Having a driver's license is an advantage for this job.", @@ -30989,6 +31010,13 @@ "id": "ID=59500_222175", "chars": "全君定拘束決諸部" }, + { + "ja": "彼は鳥が頭上を飛んでいくのを眺めるのが好きです。", + "en": "He likes to watch the birds fly above his head.", + "expl": "彼(かれ)[01] は 鳥[01] が 頭上 を[03] 飛ぶ[01]{飛んで} 行く{いく} の を 眺める の が 好き(すき) です", + "id": "ID=301656_102038", + "chars": "上好彼眺頭飛鳥" + }, { "ja": "よい食べ物と十分な睡眠は健康にとって絶対に必要だ。", "en": "Good food and enough sleep are absolutely necessary to good health.", @@ -31010,6 +31038,13 @@ "id": "ID=263846_150711", "chars": "幸才持殊特生者能" }, + { + "ja": "それはわが国の産業の発展を妨げている。", + "en": "It interferes with our industrial development.", + "expl": "其れ[01]{それ} は 我が国{わが国} の 産業 の 発展 を 妨げる{妨げている}", + "id": "ID=42593_205349", + "chars": "国妨展業産発" + }, { "ja": "神が愛する人には飼い犬から子豚が生まれる。", "en": "Whom God loves, his bitch brings forth pigs.", @@ -31017,6 +31052,13 @@ "id": "ID=269621_144942", "chars": "人子愛犬生神豚飼" }, + { + "ja": "観光客は町中飲み歩いてどんちゃん騒ぎをした。", + "en": "The tourists painted the whole town red.", + "expl": "観光客 は 町中(まちじゅう) 飲む[01]{飲み} 歩く{歩いて} どんちゃん騒ぎ~ を 為る(する){した}", + "id": "ID=20918_183795", + "chars": "中光客歩町観飲騒" + }, { "ja": "この壮大な大聖堂の建立は中世にまでさかのぼる。", "en": "This magnificent cathedral dates back to the Middle Ages.", @@ -31038,6 +31080,34 @@ "id": "ID=238332_176134", "chars": "亡人妨察犯警逃" }, + { + "ja": "山頂からの眺めは壮観だった。", + "en": "The view from the mountain top was spectacular.", + "expl": "山頂 から の 眺め は 壮観 だ{だった}", + "id": "ID=245097_169389", + "chars": "壮山眺観頂" + }, + { + "ja": "下痢止めです。", + "en": "Here's some medicine for diarrhea.", + "expl": "下痢~ 止め(どめ)~ です", + "id": "ID=25350_188211", + "chars": "下止痢" + }, + { + "ja": "古代では疫病でたくさんの人が死んだ。", + "en": "In ancient times, plagues killed many people.", + "expl": "古代 で(#2028980) は 疫病 で(#2028980) 沢山{たくさん} の 人(ひと) が 死ぬ{死んだ}", + "id": "ID=239873_174596", + "chars": "人代古死疫病" + }, + { + "ja": "特殊な才能を与えられた動物もいる。", + "en": "Some animals are endowed with special gifts.", + "expl": "特殊{特殊な} 才能 を 与える[01]{与えられた} 動物 も 居る(いる){いる}", + "id": "ID=280534_123463", + "chars": "与動才殊物特能" + }, { "ja": "君はあまり字句に拘泥しすぎるよ。", "en": "You are too much letter-bound.", @@ -31094,6 +31164,20 @@ "id": "ID=49458_212179", "chars": "典壮大婚室式王祭結" }, + { + "ja": "妹の誕生日に真珠のネックレスを贈った。", + "en": "I gave my sister a pearl necklace on her birthday.", + "expl": "妹 の 誕生日 に 真珠 の ネックレス を 贈る{贈った}", + "id": "ID=322312_81403", + "chars": "妹日珠生真誕贈" + }, + { + "ja": "被告は無罪放免になった。", + "en": "The accused was absolved from the crime.", + "expl": "被告 は 無罪放免~ になる[01]{になった}", + "id": "ID=317893_85819", + "chars": "免告放無罪被" + }, { "ja": "兄は先月浦和にマイホームを建てた。", "en": "My brother had a house built in Urawa last month.", @@ -31108,6 +31192,13 @@ "id": "ID=320987_82729", "chars": "大宝工師珠真石細込" }, + { + "ja": "豚の前に真珠を投げ与えるな。", + "en": "Do not cast pearls before swine.", + "expl": "豚~ の 前(まえ) に 真珠 を 投げる[01]{投げ} 与える[01] な[01]", + "id": "ID=280735_123263", + "chars": "与前投珠真豚" + }, { "ja": "大形航空機は大きな騒音公害をもたらした。", "en": "Large planes brought about large amounts of sound pollution.", @@ -31128,6 +31219,13 @@ "expl": "此の{この} 栓 は 瓶(びん){びん} に 合う{合わない}", "id": "ID=58109_220788", "chars": "合栓" + }, + { + "ja": "たいてい、自動車事故は睡眠不足から生じている。", + "en": "In most cases, car accidents result from lack of sleep.", + "expl": "大抵{たいてい} 自動車事故 は 睡眠不足 から 生じる{生じている}", + "id": "ID=41211_203968", + "chars": "不事動故生眠睡自足車" } ] }, @@ -31408,6 +31506,13 @@ } ], "extra_examples": [ + { + "ja": "原爆は広島全体を破壊した。", + "en": "The atomic bomb destroyed the entire city of Hiroshima.", + "expl": "原爆 は 全体 を 破壊[01] 為る(する){した}", + "id": "ID=239478_174989", + "chars": "体全原壊島広爆破" + }, { "ja": "杉本夫人はいつもこぎれいな着物を着ている。", "en": "Mrs. Sugimoto always wears neat clothes.", @@ -31513,6 +31618,13 @@ "id": "ID=285786_117878", "chars": "万円家彼新概用算築費" }, + { + "ja": "医者は概して子供の養育の訓練を受けていない。", + "en": "Doctors are not as a rule trained in child rearing.", + "expl": "医者 は 概して 子供 の 養育~ の 訓練 を 受ける{受けていない}", + "id": "ID=28000_190840", + "chars": "供医受子概練者育訓養" + }, { "ja": "薪割りを好む人が多いのは理解できる。", "en": "I know why there are so many people who love chopping wood.", @@ -31660,6 +31772,13 @@ "id": "ID=277855_126137", "chars": "取古在壊映最現町画館" }, + { + "ja": "私は叙事詩よりも叙情詩の方が好きだ。", + "en": "I like lyric better than epic.", + "expl": "私(わたし)[01] は 叙事詩 よりも 叙情詩~ の 方(ほう) が 好き(すき) だ", + "id": "ID=258602_155934", + "chars": "事叙好情方私詩" + }, { "ja": "田舎に住んでから、彼の健康は徐々に快方に向かった。", "en": "His health gradually changed for the better after he went to live in the countryside.", @@ -33895,6 +34014,13 @@ "id": "ID=20143_183021", "chars": "上対援支殿申礼貴重" }, + { + "ja": "姉は注目すべき英語の進歩を遂げた。", + "en": "My sister has made remarkable progress in English.", + "expl": "姉(あね) は 注目 す可き{すべき} 英語 の 進歩 を 遂げる{遂げた}", + "id": "ID=245596_168894", + "chars": "姉歩注目英語進遂" + }, { "ja": "椎間板ヘルニアをわずらっています。", "en": "I have a slipped disc.", @@ -33937,6 +34063,13 @@ "id": "ID=327683_76035", "chars": "値周均増大幅平振数波減" }, + { + "ja": "よく結膜炎を起こします。", + "en": "I often get conjunctivitis.", + "expl": "良く[02]{よく} 結膜炎~ を 起こす{起こします}", + "id": "ID=29950_192784", + "chars": "炎結膜起" + }, { "ja": "国務長官は対外関係を統括する。", "en": "The Secretary of State administers foreign affairs.", @@ -33965,6 +34098,13 @@ "id": "ID=266485_148074", "chars": "会住化彼持文民的誇達都" }, + { + "ja": "彼のよい振る舞いに最も強い印象を受けた。", + "en": "I was most impressed by his good behavior.", + "expl": "彼(かれ)[01]{彼の} 良い{よい} 振る舞い に 最も 強い(つよい) 印象 を 受ける{受けた}", + "id": "ID=285452_118212", + "chars": "印受強彼振最舞象" + }, { "ja": "30階建の超高層ビルが突然爆発炎上した。", "en": "All of a sudden, the thirty-story skyscraper went up in flames.", @@ -33993,6 +34133,13 @@ "id": "ID=267835_146726", "chars": "上下地女室少放縛置" }, + { + "ja": "掲示板を荒らす人の精神状態がわかりません。", + "en": "I just don't understand what goes through the minds of people who troll forums.", + "expl": "掲示板 を[01] 荒らす[03]~ 人(ひと) の[01]{の} 精神状態 が 分かる{わかりません}", + "id": "ID=328682_75037", + "chars": "人態掲板状示神精荒" + }, { "ja": "政府は国内産業振興の方策を講じた。", "en": "The government has taken measures to promote domestic industry.", @@ -34007,6 +34154,13 @@ "id": "ID=36236_199038", "chars": "剛彼手投球荒速" }, + { + "ja": "選挙の結果は夕刊に載るでしょう。", + "en": "The results of the election will appear in the evening paper.", + "expl": "選挙 の 結果 は 夕刊~ に 載る[02]{載る} でしょう[01]", + "id": "ID=273536_141036", + "chars": "刊夕挙果結載選" + }, { "ja": "試験に落ちた学生の名前は掲示板に張り出された。", "en": "The names of the students who failed in the examination were posted on the bulletin board.", @@ -34077,6 +34231,20 @@ "id": "ID=325041_78675", "chars": "号始小新月来説載連" }, + { + "ja": "我々の計画の成功には、君の援助がどうしても必要だ。", + "en": "Your help is vital to the success of our plan.", + "expl": "我々 の 計画 の 成功 には 君(きみ)[01]{君の} 援助 が 如何しても{どうしても} 必要[01] だ", + "id": "ID=23026_185894", + "chars": "功助君必成我援画要計" + }, + { + "ja": "彼は操縦士としての自分の技術を大変誇りにしている。", + "en": "He is very proud of his skill as a pilot.", + "expl": "彼(かれ)[01] は 操縦士 として の 自分[01] の 技術 を 大変 誇り に 為る(する){している}", + "id": "ID=300821_102873", + "chars": "分士変大彼技操縦自術誇" + }, { "ja": "科学は今世紀になって急速な進歩を遂げた。", "en": "Science has made rapid progress in this century.", @@ -34356,6 +34524,13 @@ "id": "ID=308504_95202", "chars": "僕切受女彼望申諾込" }, + { + "ja": "彼は街頭で買った絵を額縁に入れた。", + "en": "He framed the picture he had bought on the street.", + "expl": "彼(かれ)[01] は 街頭 で(#2028980) 買う{買った} 絵 を 額縁[01]~ に 入れる{入れた}", + "id": "ID=294771_108919", + "chars": "入彼絵縁街買頭額" + }, { "ja": "彼は過去の苦しい生活を黙想した。", "en": "He meditated on his past life of suffering.", @@ -34398,13 +34573,6 @@ "id": "ID=244272_170212", "chars": "不価安急政果格結財金騰" }, - { - "ja": "男の子が縁石の方へカートをゆっくり押しやっている。", - "en": "A boy is taking his sweet time pushing the cart toward the curb.", - "expl": "男の子(おとこのこ) が 縁石~ の 方(ほう) へ カート(#1036360)[01] を ゆっくり 押しやる{押しやっている}~", - "id": "ID=276828_127261", - "chars": "子押方男石縁" - }, { "ja": "新しい貿易区域の計画はまだ実施の段階にありません。", "en": "Plans for a new trade zone are still on the drawing board.", @@ -34482,13 +34650,6 @@ "id": "ID=239486_174981", "chars": "不住厳宅家暴賃足騰" }, - { - "ja": "飲み物はヤシの実の殻に入れてあった。", - "en": "The drinks were served in coconut shells.", - "expl": "飲み物 は 椰子{ヤシ}~ の 実(み)[01] の 殻(から)~ に 入れる{入れて} 有る{あった}", - "id": "ID=27113_189957", - "chars": "入実殻物飲" - }, { "ja": "これは亡くなった父の肖像画です。", "en": "This is a portrait of my late father.", @@ -34538,6 +34699,13 @@ "id": "ID=57221_219901", "chars": "仕文様章解釈" }, + { + "ja": "もう・・・タバコの吸殻まで散らばってるし。", + "en": "Sheesh, you've even got cigarette butts scattered around.", + "expl": "もう 煙草{タバコ} の[01]{の} 吸殻~ 迄{まで} 散らばる{散らばってる} し", + "id": "ID=328339_75380", + "chars": "吸散殻" + }, { "ja": "登山道に空き缶やゴミを捨てるのはやめてほしい。", "en": "I wish people would stop throwing away empty cans and other trash along the path up the mountain.", @@ -35711,6 +35879,13 @@ "id": "ID=302312_101384", "chars": "勉合強彼心格熱試陰験" }, + { + "ja": "彼は結婚披露宴でスピーチをした。", + "en": "He made a speech at the wedding feast.", + "expl": "彼(かれ)[01] は 結婚披露宴 で(#2028980) スピーチ を 為る(する){した}", + "id": "ID=295898_107786", + "chars": "婚宴彼披結露" + }, { "ja": "塩水の方が淡水よりも浮力が大きい。", "en": "Salt water is more buoyant than fresh water.", @@ -40517,6 +40692,13 @@ } ], "extra_examples": [ + { + "ja": "聴衆は、退屈した表情で、劇場から出ていった。", + "en": "The audience walked out of the theater, looking bored.", + "expl": "聴衆 は 退屈 為る(する){した} 表情 で(#2028980) 劇場 から 出て行く{出ていった}", + "id": "ID=277921_126071", + "chars": "出劇場屈情聴衆表退" + }, { "ja": "鉛筆1本と紙を何枚か下さい。", "en": "Please give me a pencil and some sheets of paper.", @@ -40545,6 +40727,20 @@ "id": "ID=329313_74407", "chars": "供子損時無砲鉄" }, + { + "ja": "猫は小鳥に忍び寄った。", + "en": "The cat crept toward the bird.", + "expl": "猫(ねこ)[01] は 小鳥 に 忍び寄る{忍び寄った}", + "id": "ID=282059_121944", + "chars": "寄小忍猫鳥" + }, + { + "ja": "彼は浴槽に水を出しっぱなしにしている。", + "en": "He has the water running in the bathtub.", + "expl": "彼(かれ)[01] は 浴槽 に 水(みず) を 出しっぱなし に 為る(する){している}", + "id": "ID=304533_99166", + "chars": "出彼槽水浴" + }, { "ja": "熱帯の太陽は容赦なくぎらぎら照り付けた。", "en": "The tropical sun glared down relentlessly.", @@ -40636,6 +40832,13 @@ "id": "ID=31417_194244", "chars": "切堪忍慢我緒袋" }, + { + "ja": "会社の収益は飛躍的に増加した。", + "en": "The company's profits soared.", + "expl": "会社 の 収益 は 飛躍的{飛躍的に}~ 増加 為る(する){した}", + "id": "ID=22399_185271", + "chars": "会加収増的益社躍飛" + }, { "ja": "市は困窮者に毛布を支給した。", "en": "The city supplied the needy with blankets.", @@ -40643,6 +40846,13 @@ "id": "ID=246118_168367", "chars": "困市布支毛窮給者" }, + { + "ja": "殺人の有罪宣告を受け、彼は終身刑を科せられた。", + "en": "Having been convicted of murder, he was sentenced to life imprisonment.", + "expl": "殺人 の 有罪 宣告 を 受ける{受け} 彼(かれ)[01] は 終身刑 を 科する{科せられた}", + "id": "ID=244935_169552", + "chars": "人刑受告宣彼有殺科終罪身" + }, { "ja": "遅かれ早かれ捕虜達は釈放されるだろう。", "en": "Sooner or later, the hostages will be released.", @@ -40713,6 +40923,13 @@ "id": "ID=255967_158562", "chars": "亜佐好子方知私紀" }, + { + "ja": "候補者たちは減税法案をめぐって応酬しました。", + "en": "Candidates traded blows over the proposed tax cut.", + "expl": "候補者 達{たち} は 減税 法案 を巡って{をめぐって}~ 応酬[01]~ 為る(する){しました}", + "id": "ID=240375_174095", + "chars": "候応案法減税者補酬" + }, { "ja": "氷のような冷気が車内に忍び込んできた。", "en": "An icy chill stole into the car.", @@ -43731,6 +43948,13 @@ "id": "ID=271945_142625", "chars": "太子沈西貞陽" }, + { + "ja": "あの少年の名前は和田慎太郎です。", + "en": "That boy's name is Shintaro Wada.", + "expl": "彼の(あの){あの} 少年 の 名前[01] は です", + "id": "ID=68213_230846", + "chars": "前名和太少年慎田郎" + }, { "ja": "私は慎太郎君は英語を上手に話すと思います。", "en": "I think that Shintaro speaks English well.", @@ -43780,13 +44004,6 @@ "id": "ID=20213_183091", "chars": "不人働則外戸症的眠苦規" }, - { - "ja": "急いては事を仕損じるよ。もう少々慎重に。", - "en": "Be more careful. Rushing through things is going to ruin your work.", - "expl": "急く{急いて} は 事(こと) を 仕損じる~ よ もう 少々 慎重{慎重に}", - "id": "ID=19728_182586", - "chars": "事仕少急慎損重" - }, { "ja": "彼女は衣料品を買うときは注意深く選択する。", "en": "She makes careful choices when she buys clothes.", @@ -45770,6 +45987,13 @@ "expl": "芝刈り機~ が 簡素{簡素な}~ 作り(つくり) の 荷車~ に 積む{積んである}", "id": "ID=265279_149279", "chars": "作刈機積簡素芝荷車" + }, + { + "ja": "その摩天楼はまわりの他の建物の上方にそびえていた。", + "en": "The skyscraper rose above the other buildings around.", + "expl": "其の[01]{その} 摩天楼~ は 回り[02]{まわり} の 他(ほか){他の} 建物 の 上方(じょうほう)~ に 聳える{そびえていた}", + "id": "ID=43841_206592", + "chars": "上他天建摩方楼物" } ] }, @@ -48894,6 +49118,13 @@ "id": "ID=294664_109026", "chars": "償取受多彼怪我賠金額" }, + { + "ja": "口は体の死刑執行人であり医者である。", + "en": "The mouth is the executioner and the doctor of the body.", + "expl": "口(くち)[05] は 体(からだ) の 死刑執行~ 人(ひと) である{であり} 医者 である", + "id": "ID=240549_173921", + "chars": "人体刑医口執死者行" + }, { "ja": "トラファルガー広場にはネルソン提督の彫像がある。", "en": "There is a statue of Nelson in Trafalgar Square.", @@ -49020,13 +49251,6 @@ "id": "ID=43486_206240", "chars": "候挙果立結者胆落補選" }, - { - "ja": "警察は殺人罪で沙知代を告発した。", - "en": "The police charged Sachiyo with the murder.", - "expl": "警察 は 殺人罪 で(#2028980) を 告発 為る(する){した}", - "id": "ID=238281_176184", - "chars": "人代告察殺沙発知罪警" - }, { "ja": "政府は作物が受けた被害に対して農民に補償した。", "en": "The government compensated the farmers for the damage to the crops.", @@ -49697,6 +49921,27 @@ "id": "ID=327420_76300", "chars": "人何手故派目苦鷹" }, + { + "ja": "伊藤さんという方がお会いしたいそうです。", + "en": "A person named Itoh wants to meet you.", + "expl": "さん と言う{という} 方(かた)[01] が 会う[01]{お会い} したい そうだ[02]{そうです}", + "id": "ID=465075_191152", + "chars": "伊会方藤" + }, + { + "ja": "その知らせは伊藤君が私に伝えてくれた。", + "en": "The news was told to me by Ito.", + "expl": "其の[01]{その} 知らせ は 君(きみ) が 私(わたし)[01] に 伝える{伝えて} 呉れる{くれた}", + "id": "ID=45218_207961", + "chars": "伊伝君知私藤" + }, + { + "ja": "私も伊藤さんにお目にかかれて光栄です。", + "en": "I'm glad to meet you, too, Mr Ito.", + "expl": "私(わたし)[01] も さん に お目に掛かる[01]{お目にかかれて} 光栄 です", + "id": "ID=262351_152199", + "chars": "伊光栄目私藤" + }, { "ja": "私は伊丹十三監督の全ての映画が好きです。", "en": "I like all films that Juzo Itami directs.", @@ -49725,6 +49970,20 @@ "id": "ID=277291_126799", "chars": "子少智本漫画白貸面" }, + { + "ja": "伊藤さんはたいへん学識のある人です。", + "en": "Mr Ito is a highly educated man.", + "expl": "さん は 大変{たいへん} 学識 の[03]{の} 有る{ある} 人(ひと) です", + "id": "ID=28310_191150", + "chars": "人伊学藤識" + }, + { + "ja": "伊藤さんにアポ取っておいてくれる?", + "en": "Will you make an appointment with Mr Ito?", + "expl": "さん に アポ 取る(とる){取って} 置く{おいて} 呉れる{くれる}", + "id": "ID=28311_191151", + "chars": "伊取藤" + }, { "ja": "農夫が畑に種を蒔いている。", "en": "The farmer is scattering seeds over the field.", @@ -49732,6 +49991,13 @@ "id": "ID=282312_121693", "chars": "夫畑種蒔農" }, + { + "ja": "飛行機は時刻通り伊丹空港に着いた。", + "en": "The plane put down at Itami Airport on time.", + "expl": "飛行機 は 時刻 通り(どおり)[01] 空港 に 着く(つく)[01]{着いた}", + "id": "ID=318075_85638", + "chars": "丹伊刻時機港着空行通飛" + }, { "ja": "ハレー彗星は、80年ごとに1度やってくる。", "en": "Halley's Comet comes round once every eighty years.", @@ -49746,6 +50012,27 @@ "id": "ID=276063_137173", "chars": "持目鋭鷹" }, + { + "ja": "伊藤先生は生徒達を一生懸命勉強させた。", + "en": "Miss Ito made her students work hard.", + "expl": "先生(せんせい)[01] は 生徒 達 を 一生懸命 勉強[01] 為せる{させた}", + "id": "ID=28302_191143", + "chars": "一伊先勉命強徒懸生藤達" + }, + { + "ja": "新鮮な伊勢エビを見たら、食欲がわいた。", + "en": "The sight of fresh lobster gave me an appetite.", + "expl": "新鮮{新鮮な} 伊勢海老{伊勢エビ} を 見る{見たら} 食欲 が 湧く[03]{わいた}", + "id": "ID=269321_145242", + "chars": "伊勢新欲見食鮮" + }, + { + "ja": "伊藤氏といえば、息子さんはどうなりましたか。", + "en": "Talking of Mr Ito, what has become of his son?", + "expl": "氏(し)[01] と言えば[01]{といえば} 息子[01] さん は 如何(どう){どう} 成る{なりました} か", + "id": "ID=28308_191148", + "chars": "伊子息氏藤" + }, { "ja": "農民が穀物の種を蒔いた。", "en": "The peasant scattered the seeds of grain.", @@ -49795,6 +50082,13 @@ "id": "ID=45010_207756", "chars": "分半大鳥鷹" }, + { + "ja": "伊藤教授は言語学の研究のためアメリカへ行った。", + "en": "Professor Ito went to the United States for the purpose of studying linguistics.", + "expl": "教授 は 言語学 の 研究 の 為(ため){ため} 亜米利加{アメリカ} へ 行く[01]{行った}", + "id": "ID=28309_191149", + "chars": "伊学授教研究藤行言語" + }, { "ja": "ハレー彗星は、2061年に戻ってくる。", "en": "Halley's Comet will come back in 2061.", @@ -49809,6 +50103,13 @@ "id": "ID=37801_200599", "chars": "元友子気綾達" }, + { + "ja": "伊勢エビが大好きなのですが、非常に高いのです。", + "en": "I am very fond of lobsters, but they are very, very expensive.", + "expl": "伊勢海老{伊勢エビ}~ が 大好き なのだ{なのです} が[03] 非常に 高い[02] のです", + "id": "ID=28314_191154", + "chars": "伊勢大好常非高" + }, { "ja": "美智子はまるで北極に行って来たような口ぶりだ。", "en": "Michiko talks as if she had been to the Arctic herself.", @@ -49823,6 +50124,13 @@ "id": "ID=30973_193805", "chars": "佐子日智本来藤" }, + { + "ja": "蒔かぬ種は生えない。", + "en": "You must sow before you can reap.", + "expl": "撒く{蒔かぬ} 種(たね)[01]~ は 生える[01]{生えない}", + "id": "ID=264882_149676", + "chars": "生種蒔" + }, { "ja": "ジョニーは46年間りんごの種子を蒔き付けた。", "en": "Johnny kept planting apple seeds for 46 years.", @@ -49837,6 +50145,20 @@ "id": "ID=27877_190717", "chars": "一家磯行野" }, + { + "ja": "伊藤氏は事務所で熱く感じたのでネクタイを緩めた。", + "en": "Mr Ito loosened his tie because he felt hot in his office.", + "expl": "氏(し)[01] は 事務所 で(#2028980) 熱い{熱く} 感じる{感じた} ので ネクタイ を[01] 緩める{緩めた}", + "id": "ID=28307_191147", + "chars": "事伊務感所氏熱緩藤" + }, + { + "ja": "急がなくちゃだめだよ。伊藤先生が出席をとるよ。", + "en": "We've got to hurry. Mr Itoh will call the roll.", + "expl": "急(きゅう) が 無くちゃ{なくちゃ} 駄目{だめ} だ よ 先生(せんせい)[02] が 出席 を 取る{とる} よ[01]", + "id": "ID=19694_182551", + "chars": "伊先出席急生藤" + }, { "ja": "伊藤太郎は有罪と判決された。", "en": "Taro Ito was found guilty.", @@ -50862,13 +51184,6 @@ "id": "ID=263706_150850", "chars": "事全原因完故謎" }, - { - "ja": "諸君、ちょっと御挨拶申し上げます。", - "en": "Gentlemen, allow me to say a few words in greeting.", - "expl": "諸君[02]~ 一寸(ちょっと){ちょっと} 御(ご) 挨拶[02] 申し上げる[01]{申し上げます}", - "id": "ID=267164_147396", - "chars": "上君御拶挨申諸" - }, { "ja": "その子供は、つまずいて転んで膝を突いた。", "en": "The kid stumbled and fell to his knees.", @@ -50974,6 +51289,13 @@ "id": "ID=257345_157188", "chars": "与乞全持私部金食" }, + { + "ja": "挨拶は礼儀作法の根本である。", + "en": "Greetings are the basis of good manners.", + "expl": "挨拶[01] は 礼儀作法 の 根本(こんぽん)[02]~ である", + "id": "ID=28679_191517", + "chars": "作儀拶挨本根法礼" + }, { "ja": "兄の膝は怪我で手術が必要かもしれない。", "en": "My brother may have to be operated on for the knee injury.", @@ -53599,6 +53921,13 @@ "id": "ID=46369_209108", "chars": "力努少岸年海無着辿駄" }, + { + "ja": "この林檎は腐っている。", + "en": "This apple is bad.", + "expl": "此の{この} 林檎 は 腐る{腐っている}", + "id": "ID=56499_219183", + "chars": "林檎腐" + }, { "ja": "マスコミが彼の婚約の噂を嗅ぎつけ早速駆けつけた。", "en": "The media got wind of a rumor about his engagement and came quickly.", @@ -53606,6 +53935,27 @@ "id": "ID=26634_424534", "chars": "嗅噂婚彼早約速駆" }, + { + "ja": "その少年は狼が来ると言った。", + "en": "The boy said a wolf would come.", + "expl": "其の[01]{その} 少年 は 狼~ が 来る(くる)[01] と 言う{言った}", + "id": "ID=46275_209015", + "chars": "少年来狼言" + }, + { + "ja": "7月10日より札幌支店を開設いたします。", + "en": "On July 10, we will open our Sapporo branch.", + "expl": "七月{7月} 十日[01]{10日} より[03]~ 札幌~ 支店~ を 開設~ 致す{いたします}", + "id": "ID=72384_235007", + "chars": "幌店支日月札設開" + }, + { + "ja": "その企業が倒産するという噂が広まっている。", + "en": "There's a rumor in the air that the firm is going into bankruptcy.", + "expl": "其の[01]{その} 企業 が 倒産 為る(する){する} と言う{という} 噂 が 広まる{広まっている}", + "id": "ID=48849_211572", + "chars": "企倒噂広業産" + }, { "ja": "あのグリーンの縞のシャツ、今洗濯してるん?", "en": "Is that green striped shirt in the wash?", @@ -53613,6 +53963,13 @@ "id": "ID=328929_74790", "chars": "今洗濯縞" }, + { + "ja": "すっぱい木においしい林檎はならない。", + "en": "No good apple on a sour stock.", + "expl": "酸っぱい{すっぱい}~ 木(き) に 美味しい{おいしい} 林檎 は ならない", + "id": "ID=51937_214645", + "chars": "木林檎" + }, { "ja": "私達は東京から札幌まで飛行機に乗りました。", "en": "We took a plane from Tokyo to Sapporo.", @@ -53634,6 +53991,20 @@ "id": "ID=324866_78850", "chars": "匹殺狼羊" }, + { + "ja": "札幌は、日本で5番目に大きな都市だ。", + "en": "Sapporo is the fifth largest city in Japan.", + "expl": "札幌 は 日本 で(#2028980) 番目 に 大きな 都市 だ", + "id": "ID=244929_169557", + "chars": "大市幌日本札番目都" + }, + { + "ja": "戦場は死んだ人々と瀕死の人々でいっぱいだ。", + "en": "The battlefield was full of the dead and the dying.", + "expl": "戦場 は 死ぬ{死んだ} 人々(ひとびと) と 瀕死{瀕死の} 人々(ひとびと) で(#2028980) 一杯{いっぱい} だ", + "id": "ID=273256_141315", + "chars": "人場戦死瀕" + }, { "ja": "狼と犬の区別がつきますか。", "en": "Can you tell wolves from dogs?", @@ -53676,6 +54047,20 @@ "id": "ID=276326_136910", "chars": "初山最着誰辿頂" }, + { + "ja": "その林檎はまだ熟していないよ。", + "en": "The apple is not yet ripe.", + "expl": "其の[01]{その} 林檎 は 未だ[02]{まだ} 熟す(じゅくす){熟していない} よ", + "id": "ID=43455_206209", + "chars": "林檎熟" + }, + { + "ja": "この鳥は絶滅の危機に瀕している。", + "en": "This bird is in danger of dying out.", + "expl": "此の{この} 鳥[01] は 絶滅 の 危機 に 瀕する{瀕している}", + "id": "ID=57819_220497", + "chars": "危機滅瀕絶鳥" + }, { "ja": "多くの弱い生物種が絶滅の危機に瀕している。", "en": "Many fragile species are on the verge of extinction.", @@ -53683,6 +54068,13 @@ "id": "ID=274866_138369", "chars": "危多弱機滅瀕物生種絶" }, + { + "ja": "彼女の振る舞いがいろんな噂の原因になった。", + "en": "Her behavior gave rise to rumors.", + "expl": "彼女[01]{彼女の} 振る舞い が 色んな{いろんな} 噂 の 原因 になる[01]{になった}", + "id": "ID=309298_94264", + "chars": "原噂因女彼振舞" + }, { "ja": "マユコは私の林檎を一口食べた。", "en": "Mayuko took a bite of my apple.", @@ -53690,6 +54082,20 @@ "id": "ID=32377_195204", "chars": "一口林檎私食" }, + { + "ja": "瀕死の患者の家族についてはどうでしょうか。", + "en": "What about the family of the dying patient?", + "expl": "瀕死{瀕死の} 患者 の 家族 に就いて{について} は 如何(どう){どう} でしょうか", + "id": "ID=318497_85216", + "chars": "家患族死瀕者" + }, + { + "ja": "ある日彼女は森で狼に出会った。", + "en": "One day she met a wolf in the woods.", + "expl": "ある日 彼女[01] は 森[01] で(#2028980) 狼 に 出会う{出会った}", + "id": "ID=67150_229788", + "chars": "会出女彼日森狼" + }, { "ja": "水増し決算の噂で株価は上がりませんでした。", "en": "The stock got creamed when they got wind of the dilution.", @@ -53704,6 +54110,13 @@ "id": "ID=43454_206208", "chars": "分割半取林檎" }, + { + "ja": "その噂は結局事実であることが解った。", + "en": "The rumor turned out to be true.", + "expl": "其の[01]{その} 噂 は 結局 事実 である 事(こと){こと} が 分かる{解った}", + "id": "ID=405710_212307", + "chars": "事噂実局結解" + }, { "ja": "たばこをお吸いの方は後部座席にお坐り下さい。", "en": "Smokers are asked to occupy the rear seats.", @@ -53718,6 +54131,13 @@ "id": "ID=287209_116460", "chars": "区域店彼町賑" }, + { + "ja": "母を見送りに札幌駅に行ってきたところです。", + "en": "I have just been to Sapporo Station to see my mother off.", + "expl": "母(はは) を 見送り に 札幌 駅 に 行く{行って} 来る(くる){きた} 所(ところ){ところ} です", + "id": "ID=320783_82933", + "chars": "幌札母行見送駅" + }, { "ja": "次の一節はある有名な寓話から引用したものです。", "en": "The following passage was quoted from a well-known fable.", @@ -53746,6 +54166,13 @@ "id": "ID=269980_144584", "chars": "人値其打柄産財" }, + { + "ja": "今まであなたが辿った道を見つめなおしてみましょう。", + "en": "Let's look at the path that you've walked so far.", + "expl": "今まで 貴方(あなた)[01]{あなた} が 辿る[01]{辿った} 道(みち) を 見つめなおす{見つめなおして}~ 見る(みる){みましょう}", + "id": "ID=71354_233981", + "chars": "今見辿道" + }, { "ja": "総選挙がありそうだと言う噂が流れていた。", "en": "A general election was in the air.", @@ -55554,6 +55981,20 @@ "id": "ID=69430_232062", "chars": "今山登蘇阿" }, + { + "ja": "己の欲せざる所は人に施す勿れ。", + "en": "Do to others as you would have others do to you.", + "expl": "己(おのれ)[01] の 欲する{欲せ} ざる~ 所(ところ) は 人(ひと) に 施す 勿れ", + "id": "ID=239912_174557", + "chars": "人勿己所施欲" + }, + { + "ja": "彼は些細なことで腹をたてる傾向がある。", + "en": "He tends to get angry over trifles.", + "expl": "彼(かれ)[01] は 些細{些細な} 事(こと){こと} で(#2028980) 腹を立てる{腹をたてる} 傾向 が[01] 有る{ある}", + "id": "ID=296673_107013", + "chars": "些傾向彼細腹" + }, { "ja": "敵はその砦を占領した。", "en": "The enemy occupied the fort.", @@ -55561,6 +56002,13 @@ "id": "ID=278671_125321", "chars": "占敵砦領" }, + { + "ja": "諺に、覆水盆に返らずと言う。", + "en": "The proverb says that what is done cannot be undone.", + "expl": "諺 に 覆水盆に返らず~ と 言う", + "id": "ID=239802_174667", + "chars": "水盆覆言諺返" + }, { "ja": "不思議な感じが蘇ってきた。", "en": "The strange feeling came back.", @@ -55568,6 +56016,20 @@ "id": "ID=318628_85085", "chars": "不思感蘇議" }, + { + "ja": "ペート先生は百人の人間の前で喋るのが怖い気がした。", + "en": "Miss Pate felt timid about making a speech before a hundred people.", + "expl": "先生(せんせい)[02] は 百 人(にん) の 人間(にんげん)[01] の 前(まえ) で(#2028980) 喋る の が 怖い 気がする{気がした}", + "id": "ID=34021_196842", + "chars": "人先前喋怖気生百間" + }, + { + "ja": "私が今日あるのはおじのお蔭である。", + "en": "I owe what I am today to my uncle.", + "expl": "私(わたし)[01] が 今日 有る{ある} の は 叔父{おじ} の お陰{お蔭} である", + "id": "ID=250296_156966", + "chars": "今日私蔭" + }, { "ja": "この記念碑は祖国に命を捧げた兵士を祭っている。", "en": "This monument is dedicated to the soldiers who gave their lives to their country.", @@ -55582,6 +56044,13 @@ "id": "ID=239051_175414", "chars": "喧嘩次見野集馬" }, + { + "ja": "私は来週ニューヨークに行く筈になっている。", + "en": "I'm supposed to go to New York next week.", + "expl": "私(わたし)[01] は 来週 紐育{ニューヨーク} に 行く 筈 になる[01]{になっている}", + "id": "ID=262139_152411", + "chars": "来私筈行週" + }, { "ja": "横には喧嘩状態の妻が眠っている。", "en": "To my side, my wife, who I'm presently at odds with, lies sleeping.", @@ -55645,6 +56114,13 @@ "id": "ID=328426_75293", "chars": "優先初勿最束約論謝" }, + { + "ja": "老人は杖をついていた。", + "en": "The old man walked with a stick.", + "expl": "老人 は 杖(つえ) を 付く(つく){ついていた}", + "id": "ID=326449_77270", + "chars": "人杖老" + }, { "ja": "パーティーには食べ物や飲物が豊富に揃えて有った。", "en": "There was food and drink in abundance at the party.", @@ -55680,6 +56156,13 @@ "id": "ID=47810_210542", "chars": "全安撃攻砦" }, + { + "ja": "その夫婦は喧嘩をしたが、すぐに仲直りをした。", + "en": "The couple quarreled, but soon made up.", + "expl": "其の(その)[01]{その} 夫婦(ふうふ) は 喧嘩 を 為る(する){した} が 直ぐに{すぐに} 仲直り を 為る(する){した}", + "id": "ID=318735_84977", + "chars": "仲喧嘩夫婦直" + }, { "ja": "コンサートの最中に喋るのは無作法である。", "en": "To talk during a concert is rude.", @@ -55729,12 +56212,26 @@ "id": "ID=280815_123185", "chars": "出映母汝空親顔" }, + { + "ja": "市はその将軍に敬意を表して記念碑を捧げた。", + "en": "The city dedicated a monument in honor of the general.", + "expl": "市(し) は 其の[01]{その} 将軍 に 敬意 を 表す(あらわす){表して} 記念碑 を 捧げる{捧げた}", + "id": "ID=246120_168372", + "chars": "将市念意捧敬碑表記軍" + }, { "ja": "道具としての実需がないから品揃えに深みがでない。", "en": "There's no demand for them as tools, so the product line-up is poor.", "expl": "道具 として の 実需~ が 無い{ない} から 品揃え~ に 深み が 出る{でない}", "id": "ID=329466_74254", "chars": "具品実揃深道需" + }, + { + "ja": "そのアパートはビクトリア朝風の家具を揃えてあった。", + "en": "The apartment was furnished in the Victorian style.", + "expl": "其の[01]{その} アパート[02] は ビクトリア 朝風(ちょうふう){朝風の}~ 家具 を[01] 揃える{揃えて} 有る{あった}", + "id": "ID=50691_213405", + "chars": "具家揃朝風" } ] }, diff --git a/src/main.rs b/src/main.rs index 04a9e80..598f147 100644 --- a/src/main.rs +++ b/src/main.rs @@ -1025,6 +1025,7 @@ fn add_extra_examples(all_batches: &mut [Batch], examples: &[Example]) { .map(|x| x.chars.chars().iter().copied()) .flatten(), ); + let mut in_batch_extra = Charset::default(); while batch.extra_examples.len() < 40 { let best = candidates .iter() @@ -1051,10 +1052,11 @@ fn add_extra_examples(all_batches: &mut [Batch], examples: &[Example]) { }) .max_by_key(|(_, _, w1, w2, w3)| (-(*w1 as i64), *w2, -(*w3 * 100_000f32) as i64)); if let Some((i, ex, w1, w2, w3)) = best { - if w2 > 0 || batch.extra_examples.len() < 20 { + if ex.chars.diff(&in_batch_extra).len() > 0 || batch.extra_examples.len() < 20 { println!("{}\t{}\t{:.2}\t{} - {}", w1, w2, w3, ex.ja, ex.en); batch.extra_examples.push(ex.clone()); in_batch = in_batch.union(&ex.chars); + in_batch_extra = in_batch_extra.union(&ex.chars); for c in ex.chars.chars().iter() { *char_seen_count.entry(*c).or_default() += 1; if batch.chars.chars().contains(c) { -- cgit v1.2.3