「第二回燐字書き取り」分割

1. さて

1枚目の原稿用紙の表の4頂点に位置する4字の(マスの左上の)座標をGIMPで取ると

実験をすると

      y1,   y2       s1 s2
左上:  362,  398 --->  0, 0
右上: 5606,  406 --->  7, 0
左下:  348, 8132 --->  0,14
右下: 5586, 8136 --->  7,14

である。うまいパラメータt10, t11, t12, t20, t21, t22を持ってきて、

となるようにしてやれば良い。ただしs0たちは全部1である。

Y ≒ TSで最小二乗法をやるのでYST=TSSTを解けばよく、T=YST(SST)-1なのでTは

[[ 363.5,         748.71428571,   -1.21428571],
 [ 399. ,           0.85714286,  552.28571429]]

なるほど。実際にやってみると上手くいったのでやったぜ。

さて、二枚目の原稿用紙も同様にやっていこう。実験をすると

       y1,   y2      s1 s2
左上:  296,  378 --->  0, 0
右上: 5532,  362 --->  7, 0
左下:  302, 8106 --->  0,14
右下: 5542, 8092 --->  7,14 

なのでTは

[[  2.95000000e+02,   7.48285714e+02,   5.71428571e-01],
 [  3.77500000e+02,  -2.14285714e+00,   5.52071429e+02]]

だそうだ。

3. 分割して保存

それぞれの画像に分割して保存していかねば。

とはいえ、ローカルへの保存だけはJavaScriptでは書きづらいからなぁ。前回は手で280枚ぐらいを保存していったが、流石にめんどいのでPythonを使う。