先日、二次元画像を綺麗に拡大できるとして、waifu2x-caffeを紹介しました。
この紹介したバージョンは、v1.0.2だったんですが、v1.0.5より、機械学習を利用して、写真を鮮明に拡大できる機能が追加されました。
今回、いろいろな写真で、この機能を試してみたので紹介です。
目次
waifu2xとは
waifu2xとは、簡単に説明すると人工知能技術を利用した画像拡大ソフトです。
人工知能に、与えられた画像を圧縮画像と解釈させ「この圧縮画像の圧縮前の画像を求めよ」という問いの答えが出力されるアルゴリズムになっている画像拡大ソフトです。
で、waifu2x-caffeは、Windows64bit環境に対応した、ソフトになっています。こちらはローカルで動作するので、サーバに負荷をかけずに利用することができます。
その他にも、派生ソフトはいろいろあります。
waifu2xを利用した写真の拡大
早速、以下の横幅200pxの写真を拡大してみました。(クリックで元画像)
通常の画像ソフトで、上の写真を4倍に拡大すると以下のようになります。(クリックで拡大)
対して、waifu2x-caffeで4倍に拡大すると、以下のように拡大されました。(クリックで拡大)
このように、輪郭がくっきりと鮮明に拡大できます。
ただし、写真や、被写体、写り方によっては、くっきりしすぎないほうが良い場合もあるでしょうし、機械学習の影響が、悪い方に出てイラストっぽくなってしまうということもあると思います。なので、waifu2x-caffeを使って拡大したからといって、必ずしも良いものになるとは限りません。
waifu2x-caffeで写真を拡大する方法
waifu2x-caffeで写真を拡大するための簡単な使い方を説明します。
ファイルのダウンロード
waifu2x-caffeを利用するには、まずReleases · lltcggie/waifu2x-caffe · GitHubにあるファイルをダウンロードします。
ダウンロードした「waifu2x-caffe.zip」を解凍し、中にある「waifu2x-caffe.exe」ファイルから起動します。
起動すると、以下のようなフォームが表示されます。
エラーが出たら
このとき、もし起動時に以下のようなエラー画面が出たら、Visual Studio 2013 の Visual C++ 再頒布可能パッケージをインストールしてください。
コンピューターにMSVCP120.dllがないため、プログラムを開始できません。この問題を解決するには、プログラムを再インストールしてください。
簡単な使い方
最も簡単に写真を拡大するには、以下のように使います。
- 画像を入力エリアにドラッグ&ドロップ
- 拡大率を設定する
- モデルを「写真」に変更
- 実行ボタンを押す
エラーが出て、うまく変換できない場合は、プロセッサーをCPUにしてみてください。
NVIDIA製GPUを利用している環境であればcuDNNを利用した高速な変換も行えます。
尚、写真を拡大する場合は、「変換モード」は「拡大」しか選択できないようです。
フォルダごとまとめて変換も可能
また、waifu2x-caffeは、フォルダ単位で変換もできるので、写真をまとめて拡大なんてこともできます。
モデル「RGB」と「写真」の違い
「RGB」と「写真」の違いは、以下の超縮小写真を拡大した画像で見るとわかりやすいかもしれません。
以下は、通常の画像ソフトで拡大。
以下は、モデルが「RGB」。こちらは何となくつるっとします。
以下は、モデルが「写真」。
詳しいことはわかりませんが、「写真」モードの方が、「RGB」モードよりも、写真ぽく拡大されているのは何となくみて取れます。
いろいろな写真で試してみた
いろいろな、CC0写真で試してみました。
人物写真
冒頭も人物写真でしたが、今度は少し遠めの人物写真で試してみます。
通常の画像ソフトで拡大すると以下のようになります。
waifu2xで拡大すると、以下のようになります。
画像ソフトだと、ぼやけていた部分が、waifu2x-caffeだと多少引き締まって見えます。
物の写真(食材)
次は以下のような物の写真で試してみました。
通常の画像ソフトで拡大したものは以下。
waifu2x-caffeで拡大したものが以下。
waifu2x-caffeは、人物写真や物のような、対象物が、はっきりとした方が良いものには、相性がよさそうです。
風景写真(建物など)
通常の画像ソフトで、拡大した場合は以下。
対して、waifu2x-caffeで拡大すると以下のようになりました。
くっきりとはしているのですが、イラストっぽくも見えます。
風景写真(自然)
最後に明確な対象物がない、以下の風景写真でも試してみました。
以下は、通常の画像ソフトで拡大した場合です。
以下が、waifu2x-caffeで拡大したものです。
近くに対象物がないと、そこまでの効果は発揮されず、イラストっぽくなってしまうかもしれません。
まとめ
二次元などのイラストの場合は、基本的にはクッキリとした線で書かれたものが多いのですが、写真だとそういったものばかりでもありません。
なので写真の場合、イラストなどと違って、くっきりさせすぎると違和感を感じる人も多くなると思います。waifu2xを利用すると、やはりどうしても少しイラストっぽくはなるので、どういった写真に有効かなどかは、自ら実際に写真を拡大して試してみるしかないかもしれません。
個人的には、以下のようなものにwaifu2x-caffeの写真拡大は向いているかと思います。
- 人物や物のような輪郭がくっきりとした方が良い写真
- 近いものを写している写真
- 線がはっきりしている写真
逆に、以下のような写真には向いていないかもしれません。
- 自然などを写した風景写真
- 遠くのものを写した写真
- 背景などがぼかされた写真
結局、そこらへんは、実際に写真を拡大して自らの目で見るしかないかもしれません。
今のご時世、「小さな写真しかなくて綺麗に拡大しなくてはならない」なんてことも、あまりないかもしれませんが、「どうしてもくっきりと拡大させたい写真がある」なんて場合は、1度試してみるといいかもしれません。