OCRオシロンに、縦書きの原稿を横に読み込んでしまう問題が発生しました。
これは、GoogleのAPIが、まだ日本語の縦書きに対応しきれていないためです。
また、ChatGPTのAPIは、2024年5月に開始されたばかりなので、まだ日本語に十分対応できていなかったためです。
いろいろ修正をしましたが、根本的には直りませんので、今後は、GoogleやChatGPTのAPIが改善されるのを待つしかありません。
しかし、現在でも、ChatGPTに直接画像を読み込ませると、かなり精度の高いテキスト化をしてくれます。
OCRオシロンでテキスト化がうまくいかない場合は、ChatGPTに直接画像をアップロードしてテキスト化をしてくださるようお願いします。
https://www.mori7.com/osiron/
この記事に関するコメント
コメントフォームへ。
同じカテゴリーの記事
同じカテゴリーの記事は、こちらをごらんください。OCRの「オシロン」(0)
OCRの性能は、日々向上していますが、これまでは日本語の手書きの文字をテキスト化するのは、まだ難しい面がありました。
しかし、AIが文脈で文字を読み取れるようになってきたことで、手書きの文字の読み取り性能が一挙に上がりました。
言葉の森が開発したOCRの「オシロン」は、現在、日本の最高レベルのOCR機能を持っていると思います。
それは、AIを組み込んだOCRだからです。
言葉の森のOCRの特徴は、子供が書いた手書きの文字を補正してテキスト化することです。
その理由は、テキスト化の目的が、作文の森リン点を出せるようにすることだからです。
だから、小学1年生が書いたひらがなだけの作文も、普通の漢字仮名交じり文に変換してテキスト化します。
作文力の本質は、文章が漢字で書いてあるかひらがなで書いてあるかには関係なく
、どのような語彙で書かれているかというところにあります。
手書きで作文を書いている人は、OCRの「オシロン」を活用して、手書きの作文とテキスト化された作文の両方を作文の丘から送ってくださるといいと思います。
話は変わりますが、人間が考えることと書くことの間には、強いつながりがあります。
人間は、頭の中で考えるだけでなく、手で書きながら考えます。
パソコンでタイピングすることと考えることの間のつながりは、手で書くことことと考えることとの間のつながりよりも弱くなります。
タイピングは、考えたあとの清書のような性格の入力の仕方です。
手書きは、考えを深めながら書くという性格の入力の仕方です。
だから、将来の作文では、手書きが復活すると思われます。
その手書きの作文を「オシロン」がテキスト化するのです。
しかし、手書きは、パソコン入力よりも確かに時間がかかります。
そこで、手書きは、四行詩のような簡潔で密度の濃い書き方になっていくのだと思います。
この記事に関するコメント
コメントフォームへ。
同じカテゴリーの記事
同じカテゴリーの記事は、こちらをごらんください。OCRの「オシロン」(0)
東京大学理科一類 F.H.さん
<担当講師より>
中学高校と、ほぼ全提出で作文を続けてくれたFくん、見事志望大学に進学されました。ご本人の高い意欲と努力の賜物に違いありませんが、国語が大きく目標点を上回っていたとお聞きすると、うれしくてなりません。
作文を書く時にさまざまな対話をする際の発言にキレのある生徒さんでした。勉強一辺倒ではなく、ピアノや自転車も楽しむ高校生活でした。これからの大学生活もすばらしいものになるはずです。
おめでとうございます。
この記事に関するコメント
コメントフォームへ。
同じカテゴリーの記事
同じカテゴリーの記事は、こちらをごらんください。合格情報(27)
4月の森リン点の集計をしました。(2025/4/29)
これまでの各語彙の種類数の平均は、1200字の作文の場合、
・思考語彙=23種類
・知識語彙=59種類
・表現語彙=111種類
・経験語彙=41種類
でした。
小6から中3までの4月中の1200字以上の作品の森リン点を集計をすると、総合点は中3が79.5と最も偏差値50に近い数値でした。
森リン点は、小学校低学年の子供たちのことを考慮して、偏差値50に30を加えた80を平均としています。
また、中2の生徒の人数は、小6から中3の生徒の中で最も多かったので、中2の種類数を全体の基準とすることにしました。
新しく集計した中2の各語彙の種類数の平均は、
・思考語彙=21.2種類
・知識語彙=62.8種類
・表現語彙=114.9種類
・経験語彙=40.7種類
でした。
この中2の各語彙の種類数の平均と標準偏差を、今後の森リン点の基準とします。
すると、新しい点数は次のような傾向になります。
・思考語彙の点数は高くなります。+8.8%
・知識語彙の点数は低くなります。-7.1%
・表現語彙の点数は低くなります。-3.4%
・経験語彙の点数は高くなります。+0.7%
これまでは、難しい言葉を使うと知識語彙の点数が高くなる傾向がありました。
しかし、これからは、各語彙の点数の均衡度が低いと、総合点が低くなることがあります。
これを均衡点(バランス点)と呼びます。
均衡点(バランス点)は、+9から-10の範囲です。
それぞれの語彙の点数のバランスをよくするためには、次のようにしていくといいです。
思考語彙を上げるには、調べた知識の事実だけでなく、その知識の説明やそこで自分が考えたことを入れることです。
また、最後の段落の感想や意見の部分を、それまでの段落と同じぐらいの長さで詳しく書くことです。
しかし、思考語彙が高くなりすぎると、理屈の多い硬い文章になる可能性があります。
経験語彙を上げるには、実際に経験したり見聞したりした実例を書くことです。
ただし、経験実例を書きすぎると、読みやすいが、全体が浅い文章になる可能性があります。
知識語彙を上げるには、調べた知識などを書いて、話題を社会的に広げて書くことです。
表現語彙を上げるには、同じ語彙を使わずにできるだけ多様な語彙を使うことです。
多様な語彙を使うためには、説明文読書や意見文読書の機会を増やし、読める語彙だけでなく使える語彙の範囲を増やしていくことです。
この記事に関するコメント
コメントフォームへ。
同じカテゴリーの記事
同じカテゴリーの記事は、こちらをごらんください。森リン(103)