★阿修羅♪ > 原発・フッ素38 > 661.html
 ★阿修羅♪  
▲コメTop ▼コメBtm 次へ 前へ
「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正 (ITmedia ニュース)
http://www.asyura2.com/14/genpatu38/msg/661.html
投稿者 魑魅魍魎男 日時 2014 年 6 月 11 日 03:48:55: FpBksTgsjX9Gw
 

「ストロンチウム」→「ス卜口ンチウム」は「OCRのミス」 原子力規制庁、サイトを修正 
(ITmedia ニュース 2014/6/10)
http://www.itmedia.co.jp/news/articles/1406/10/news067.html

原子力規制委員会がWebサイトで公開している資料の中で、「ストロンチウム」の「ト」と「ロ」が漢字の「卜」(ぼく)と「口」(くち)になっていたと ネットユーザーに指摘され、サイトを公開している原子力規制庁が修正する騒ぎがあった。画像PDFをテキスト化する際、文字認識(OCR)ソフトが間違っ た文字を認識してしまったことが原因という。


誤字があったのは、今年1月に開かれた「第10回特定原子力施設監視・評価検討会汚染水対策検討ワーキンググループ」の会議資料一覧ページ。「福島第一原子力発電所におけるストロンチウム分析の状況について[東京電力]」という資料の「ト」と「ロ」がそれぞれ漢字になっており、「検索避けのためにあえて漢字にしたのでは」などと一部ネットユーザーの間で騒ぎになっていた。

 同庁によると、Webサイトに掲載するテキストは通常、手打ちで確認しているが、この会議は資料が届いたタイミングがギリギリだったため、画像 PDFをスキャンし、OCRソフトにかけてテキスト化したものをそのまま貼り付けたという。掲載時に目視で確認したが、「ト」と「ロ」が違うことに気づかずにアップしてしまったという。

 ネットユーザーからの指摘を受け、6月9日に文字を修正。あわせて、同庁サイトのHTMLにほかに同様な間違い(「キ」と「千」のミス、「力」 (ちから)と「カ」(カタカナのカ)のミスなど)がないかチェックしたところ、見つからなかったという。同庁の広報担当者は「こちらのミスで申し訳ない」 と話している。

 このほか、「東京電力」や「原子力」の「力」をカタカナの「カ」に変えてGoogle検索すると、関連のPDF資料が出てくることも話題になった。これらも画像PDFをOCRソフトにかけた際の変換ミスが原因とみられる。

------(以下コメント)------

OCRは、スキャナで取り込んだ画像ファイルを文書ファイルに変換するときに使用します。

この東電のファイル内の「ストロンチウム」は正しくカタカナが使われています。
このファイルはPDFですから、OCR変換は不要で、マウスで題名をハイライトし、
コピー&ペーストするだけで済みます。

コピペで済むことは私も確認しました。3秒で済みます。
誤変換の可能性のあるOCRをわざわざ使う理由はありません。急いでいればなおさらです。

OCRを使ったとしても、まともなOCRソフトであれば、使用率の極めて低い「卜」(ぼく)という漢字が
選ばれることは有り得ず、間違いなくカタカナの「ト」に変換されるはずです。
また、この場合のように似た字が複数ある場合は、単語データベースを参照して、
意味の通るほうを採用するはずです。

いずれにせよ、苦しい言いわけですね。
検索を逃れるために故意にやったことは、ほぼ間違いありません。極めて悪質です。

さすが原子力"寄生"委員会です。
 

  拍手はせず、拍手一覧を見る

コメント
 
01. 2014年6月11日 04:05:48 : aiMZAOJQqY
奴らが使ったのは、OCRソフトではなく、実は似た字に変換するソフトだろう。
いちいち手動で変換しているのではなく、ソフトで自動的に行なっている可能性大。

ト → 卜(ぼく)
ロ → 口(くち)
エ → 工(こう)
カ → 力(ちから)
タ → 夕(ゆう)

文章の文字を一字ずつチェックして、これらのカタカナを見つけたら、漢字に変換してしまう。
プログラミングの初歩的な知識があれば、こんなプログラムは簡単にできる。

すでに、フリーウェア、シェアウェアでこういったものがあるのかも知れない。

検索するときは十分注意が必要だ。

悪の限りを尽くしている連中を相手にしていることを忘れてはならない。


02. 2014年6月11日 05:38:16 : bwFzMVs2eU
   
              ミス?故意!風評?実害!

             原子力村住民は日本語を使うな!

                福島で独立しろ


03. 2014年6月11日 08:17:26 : oOaC4Mzlb0
01さん、その通りだと思います。
日本人は総じて、悪意の存在に鈍感で、人間それほどまでに悪くはない、と根拠なく幻想を抱いているので、詐欺師天国となっております。
悪だくみには限度がなく、可能な限り悪行に邁進します、この程度でいいと言う考え方が無い。
洗脳など、自分の住む世界には関係が無いと言う、鈍な認識により、日本人総白痴化は99パーセント進んでしまいました。
知らずにし掛けられたことな自らハマった結果が、今、と言う訳です、悲惨。

04. 2014年6月11日 10:18:11 : cUchBPexSM
嘘だ。問題のpdfを保存しているが、ocrを通した透明テキストの出力は、正確にカタカナでストロンチウムだった。なら、いったいpdfのどこをコピペしたんだ?

05. 2014年6月11日 11:10:09 : zZnTIGw0fU
規制委は前代未聞の不祥事をやらかしてしまった。

そこで言い訳を考えたのだろう。OCRに画像文書を掛けた誤変換だとしようと。
これは恥じの上塗りだよ。記事にあるように、本来の文書が画像ではない。

仮に100歩譲って誤変換がどこかで生じたとしよう。いったい規制委はチェック
なしか?OCR使えばチェックがいることは一回でもOCRを使った人間なら知っている。
グーグルで画像PDF文書を自動OCRかけているのとはちがうのだ。


06. 2014年6月11日 11:11:43 : fsDqRCe1zM
寄生委がOCRのせいにしてるなんかウソに決まってるけど、じゃOCRのソフト名えを答えさせ、みなでそのOCRで検証すれば、一発で寄生委の言い訳が大ウソだってことがバレるよー。

寄生委が言い訳してる超低レベルな誤認識するOCRなら、誰でも手に入るような安物製品に決まってるんだから一般市民が誰でも試すこと出来るよー。

OCR名答えさせようよ。ああだこうだ理由つけて教えたがらないならその時点で言い訳大ウソだってこと決定だよー。


07. 2014年6月11日 11:16:59 : HF6FBvIcSI

近代日本 一五〇年の ゆきついた地点がこれだ

   教育 

とりわけ高等教育は詭弁を弄する層を育成するためにのみ

      活用されている

官僚はもちろん 

大学教師 大企業社員 新聞社職員 テレヴィ局員 大中小の役人ども

  それらの下請け 子分 手下

       は

(愚鈍で素朴な 欲深い故に欺されやすい)大多数の凡夫匹夫/民衆を欺く

現代中国の悪口を盛んに云いながらも

『由らしむべし知らしむべからず』は論語から二五〇〇年たっても

   この国の支配層の中心思想  国是である / 笑。

       戦後民主主義 とは絵に描いた餅以上の大嘘で

          単なる支配のための「シンボル」記号 

             官僚と財閥 既得権益を独占する悪い商人たち

   薩長と三菱を利するための「登録商標」に過ぎない

恥知らずたちが散布する「幻想」から 目覚めよ 

    この国は

      筒井康隆の『アフリカの爆弾』以下である
    


08. 2014年6月11日 12:18:40 : xh9uoJz5TU
だいたい、今どき元ネタが電子データでなく、OCRが必要なシチュエーションって、どんなだ(笑)?

09. 2014年6月11日 13:27:07 : rrhrFN6JLd
そんなもん嘘に決まっているだろう。オレオレ詐欺集団なんだから。議論する価値もない。確信犯。

10. 2014年6月11日 13:32:59 : Hw9UhNgekg
モレモレ詐欺

11. 2014年6月11日 15:25:35 : asdjYoy9bU
例えば、原子力規制庁と話す時
「お宅の言うところのストロンチウムが」
じゃなくて
「お宅の言うところのスボククチンチウムが」
って言ってやろ

12. 2014年6月11日 18:25:33 : TGgfYEbPRU
リンクタイトルだけ OCR で読み込んだってか・・・。
呆れてものが言えん・・・嘘にも程ってもんが有る・・・。
ホント役人って嘘つくことにしか頭使わないよな・・・。

13. 2014年6月11日 19:38:24 : gli9B2RAJ6
【転載はじめ】
朝日新聞デジタル 
>ロイター
記事

原子力規制委員候補の田中東大教授、事業者などから760万円受領
2014年6月9日16時09分

田中知氏が規制委の専門審査会の委員に今年就任した際に、規制委が公表した情報によると、田中氏は、東京電力福島第1事故が起きた翌2011年度に、東電元会長の田村滋美氏が理事長を務める「東電記念財団」や原発メーカーの日立GEニュークリア・エナジーなどから160万円以上の報酬や寄付を受け取っている。

 これらの金額のほか、東大本部の回答によると、田中教授には原子力事業者などから2004年度から10年度にかけて合計600万円の寄付金があった。内訳は、青森県大間町で原発建設を進めている電源開発が計300万円、日立GEニュークリア・エナジー(前身の日立製作所含む)が計300万円。東大の法人化(04年度)以前については情報が残っていないという。
【転載おわり】

原子力規制委員会なんておかしいと思ったよ。
760万円ももらっていたら、そりゃぁ電力会社に味方する事を言うわな!

って事はだよ・・・原発推進の政治家はどうなんだろう?
まして「今度は福島とは全然違う原発を造ります」なんていう人はどうなんだろう?

福島の子供が甲状腺癌になって手術しようが死のうがそんな事は知っちゃいないのか?
自分の懐の760万円を守る事の方に汲汲とするような人間が原子力規制委員会の委員じゃ、そんなもの無い方がまし。

「原子力規制委員会」って何を規制しているの?
何を規制する委員会なの?
「原子力に反対する勢力を規制する委員会」って事なの?

その意味を知っている人、そこんとこ是非教えて 



14. 2014年6月12日 02:02:32 : 8z0JTJjQpY
「OCRのミス」 うそにきまってる!

騒ぎになったのでごまかしている言い訳でしかない!

醜いのう 原子力ムラ!


15. 2014年6月13日 14:33:38 : ZucfhcLauc
やあ、こんちちは!
OCRから生まれたすぼぼぽーんのボクチン、
スボボクチンチウムくんだよ!

・・・みたいなゆるキャラちょーだいな
(マヌケな顔してそ)・・・


16. 2014年6月13日 14:35:15 : ZucfhcLauc
↑どうでもいい訂正ですが、スボククチンチウムくん、でした。

17. 2014年6月13日 14:58:12 : ZucfhcLauc
あと、ネ白崎とか、ネ富島とかもあるようですね。
おフザケにも程がある。

18. 2019年3月01日 12:02:41 : YGVUEYG27s : UEpVTVJCYmUuVG8=[1] 報告
今のOCRは、使われる頻度多い単語を参照して文字を選ぶようになっているので、スト口(くち)ンチウムとあっても正しく変換されることはあっても、逆はないと思います。恐らく意図的に口(くち)の字を使ったのでしょう。

  拍手はせず、拍手一覧を見る

フォローアップ:

この記事を読んだ人はこんな記事も読んでいます(表示まで20秒程度時間がかかります。)  recommend
★登録無しでコメント可能。今すぐ反映 通常 |動画・ツイッター等 |htmltag可(熟練者向)
タグCheck |タグに'だけを使っている場合のcheck |checkしない)(各説明

←ペンネーム新規登録ならチェック)
↓ペンネーム(2023/11/26から必須)

↓パスワード(ペンネームに必須)

(ペンネームとパスワードは初回使用で記録、次回以降にチェック。パスワードはメモすべし。)
↓画像認証
( 上画像文字を入力)
ルール確認&失敗対策
画像の URL (任意):
  削除対象コメントを見つけたら「管理人に報告する?」をクリックお願いします。24時間程度で確認し違反が確認できたものは全て削除します。 最新投稿・コメント全文リスト

▲上へ      ★阿修羅♪ > 原発・フッ素38掲示板 次へ  前へ

★阿修羅♪ http://www.asyura2.com/ since 1995
スパムメールの中から見つけ出すためにメールのタイトルには必ず「阿修羅さんへ」と記述してください。
すべてのページの引用、転載、リンクを許可します。確認メールは不要です。引用元リンクを表示してください。
 
▲上へ       
★阿修羅♪  
この板投稿一覧