hirax.net::Keywords::「音声」のブログ



2001-06-21[n年前へ]

二十一世紀の「ミニスカートの幾何学」 

可愛いAIBOはちょっぴりエッチ

 「面白い記事がありましたが、読みましたか?ふふっ(笑)。」というメールが先日私に届いた。さてさて、一体どんな記事だろう?うむむ…?と見に行ってみると、それはZDNNのこんな記事だった。

SONYが"AIBO Navigator"というソフトウェアを製品化し、そのソフトウェアを使えばAIBOをPCから遠隔操作することができるというのである。なんでも、無線LANを使って、AIBOの頭部に搭載されたカメラの画像をPCで見ながら、AIBOを自由に動き回らせることができるらしい。しかも、それだけではなくて、音声を聞いたりAIBOが見ている映像を静止画撮影をしたりすることもできるらしい。なるほど、面白そうだ。鉄人28号もビックリである。さすが、二十一世紀になっただけある。

 しかし、しかし、である。これだけでは、先のメールの書き主が私にわざわざこのニュースを知らせてくれる理由がわけ判らないではないか。私はお茶ノ水博士のようなロボット博士でもなければ、TVチャンピオン常連のおもちゃオタクでもないのである。ましてや、先のメールの「ふふっ(笑)」は奇奇怪怪としか言いようが無い。もしかしたら、これは新手のAIBOの売り込みだろうか?あのSONYもついにSPAMを出すようになったか、あのSONYがなぁ、と思いつつ記事を読み進んでいくと、記事の終わり近くになってやっと疑問は氷解したのである。その部分を少し引用してみると、

 今回,遠隔撮影を可能にするAIBO Navigator開発にあたって,ソニー社内でも盗撮問題が再浮上。AIBOを担当するエンターテインメントロボットカンパニー内に「倫理委員会」を設置するなど,盗撮問題に対して真面目に取り組んだという。
 「AIBOのアタマが,ある角度以上に上を向くと,見てはいけないものが見えてしまう」(ソニー)ということで、倫理委員会では、まず盗撮される側のデータを収集。女性の平均身長の調査から始まり、短いといわれているミニスカートの丈の長さを実際に定規で測って調べ、AIBOの頭部カメラがどの角度までなら大丈夫かをさまざまな角度から調査。その結果、可動角度を最大20度とし、首の位置が20度以上動くようなモーションをしなくてはいけないときは、動画が止まる機構までも装備した
ということだそうだ。なるほど、これはまさにである。理系学生の憧れナンバー1といえばソニーであるが、そのソニーの「真心」とも言うべきソニーの「倫理委員会」と私は同じような「研究」をしていたわけである。「女性のためのミニスカート理論の構築を目指していた」ミニスカートの幾何学はまさに「真心・倫理」を具現化した研究と言っても良いくらいであるが、やはり判る人には判るのである。先のメールの主は私に「あなたのレポートはまさに日本の倫理のために役立っているのですよ」と教えて下さっているに違いないのである。もっとも、残念なことに私はソニーの倫理委員会と違って「短いといわれているミニスカートの丈の長さを実際に定規で測って調べたり」する機会には恵まれなかったのである。

 が、そんなことはさておき、「角度で20度までなら、見てはいけないものが見えない」というのは本当だろうか?それは、ミニスカートの幾何学で調べるとどういうことになるのだろうか?というわけで、このナゾについて少し考えてみたい、と思うのである。

 というわけで、まずは「ミニスカートの幾何学」の復習をしよう。ミニスカートの内側の下着が見えるか、見えないかを考えるには次のような図を考えると判りやすい。ここでは女性の真下の地点を原点にとり、水平方向にX軸をとり、鉛直上向きにY軸をとっている。
 

ミニスカートの幾何学 (縦軸=鉛直方向、横軸 = 女性からの距離)

 スカートの内側の「見てはいけないもの」が見えてしまうのは、上の図で緑の線よりも下側に入って、その緑の線より上を見上げた場合である。そして、ここでその緑の線は

  • 女性の下着の一番下の部分の位置
  • ミニスカートの一番端の下の位置
を結んだ直線ということになる。AIBOがこの緑の線よりも下の位置に可愛くトコトコ歩いてきて、そして、緑の線の角度よりも首を見上げた瞬間に、スカートの内側の「見てはいけないもの」がAIBOの目を通してAIBONavigatorを操るPCの画面に写ってしまうわけである。その角度が、可愛いAIBOがチョッピりスケベに変身してしまう限界角度なのである。

 それでは、その「限界角度」を調べるために、とっても簡単「ミニスカートの幾何学」を活用しよう。まずは、例えば女性のヒップ周りが88cmとしてみた場合に、スカート中央から端までの長さ(rcm)は、女性のヒップを円と近似すると、

2πr = 88cm
であるから、スカート中央から端までの長さ(r cm)は
r = 14cm
となる。すると、図を見ればわかるように、緑の線 -> 「下着防衛ライン」はスカートの丈を未知数として、
y = - ((スカートの丈 - 25)/14) x + 股下長さ
という式で表すことができるわけだ。ここで、「AIBOがそれ以上上を向くと見てはいけないものが見えてしまう」という緑の線の角度
ArcTan[ (スカートの丈 - 25)/14 ] / (2 π)*360
で表されるから、それを計算してみて、「スカートの丈」に対する「見てはいけないものが見えてしまう」限界角度を計算してみると、その結果は次のグラフのようになる。
 
 
「スカートの丈」に対する「見てはいけないものが見えてしまう」限界角度
横軸 : スカートの丈 (cm) 
縦軸 : 「見てはいけないものが見えない」限界角度 ( ° )

 このグラフを見れば判るように、女性のスカートが長くなれば長くなるほど、「見てはいけないものが見えてしまう」限界角度は大きくなる。当り前である。長いスカートの中を覗こうとしたら、AIBOはそのスカートの中へ入り込んで、かなりの上を見上げなければならない。もちろん、スカートの丈が短くなればなるほど、スカートの中身は覗きやすくなる。そうすると、AIBOがそれほど上を見上げなくても、「見えてはいけないもの」が見えるようになってしまうのである。

 さて、前回の「ミニスカートの幾何学」では女性達が履くスカートは短くても32cmまでであって、その長さであれば角度が30°ほどにもなる急な階段でも女性のスカートの中の「見えてはいけないもの」は見えることが無い、ということを明らかにした。というわけで、それを知ってか知らずか女性達の履くスカートは短くても32cmまでなのである。だとすれば、その32cmに対応する限界角度は「見てはいけないものが見えるための必要角度」ということになるわけである。

 すると、このグラフを見れば一目瞭然、スカートの下限「見てはいけないものが見えてしまう」限界角度は20数度よりも大きいことが判るのだ。ということは、先の記事の通りに、AIBOの首の上限角度を20度にしておけば、もうどうやってもAIBOはスカートの中身を覗くことができなくて、AIBOが盗撮者の手先となってしまう危険は防ぐことができるのである。それより上を眺めれば、見たことのない映像が見ることができるハズなのではあるが、ロボット三原則に基づいて(大ウソ)、AIBOの首はそれより上には上がらないように設計されているわけである。

 というわけで、こんな風にソニーの「倫理委員会」がうらやましいばかりの数々の実験を重ねて調べたことも、このミニスカートの幾何学から導き出すことができるのだ。あぁ、なんて社会の役に立つ研究なのだろう。こんな女性のため、社会正義のための幾何学がこの他にあるのだろうか…。しかし、そんな社会正義のための研究だったハズなのに、この「ミニスカートの幾何学」をきっかけにしてhirax.netが色モノサイト扱いされ、さらには有害サイト扱いされるようになるとは… 思いもしなかったなぁ…   ふっ… (涙)…。
 
 

2001-08-07[n年前へ]

「ボケ」た背景で包み込め 

デジカメ画像をキレイにボカそう アルゴリズム編

 最近、新しいデジカメを物色中である。私はこれまではFinePix4700zを使っていたのだけど、そのFinePixが半年程度で壊れてしまった。というわけで、C-4040ZOOMがどんなものか期待しているところである。

 壊れたFinePixと言えば、そもそも壊れたFinePixは一台ではなかった。私はすでにFinePixを二台も買っているのだ。そして、もうすでに二台とも壊れてしまっているのである。連続殺人事件ならぬ、連続カメラ自殺事件なのである。

 まず、一台目に買ったFinePix700ははメキシコのティファナでポケットから落としたら、バッテリーから電源が供給されなくなった。もちろん、ACアダプターを使えば立派に動くのだけれど、それでは少しばかり機動性に欠けてしまう。まさか発電機を持ち歩くわけにはいかないし、コンセントの近くでしか撮影することができないとなると、それは非常に困ってしまう。そこで、すかさず二代目としてFinePix4700zを私は買った。ところが、買ってから半年位たったある日、今度は勤務先の駐車場でポケットから落としてしまった。すると、今度はファインダー視野がズームに連動しなくなって、なおかつレンズがまるでジョイスティックのようにあらゆる方向に曲がるようになってしまった。

 こんな風にデジカメはとっても壊れやすくて、半年毎にデジカメ出費を強いられる私に周囲は「落としたオマエが悪い」と非常に冷たいのである。残念なのだ。「そういうのは壊れたんじゃなくて、壊したんだ」と被害者である私をまるで加害者のように告発する人さえいるのである。連続カメラ自殺事件は実は他殺で、しかも犯人は私だと告発する輩さえいるのだ。ひどい話である。
 

 ところで、C-4040に期待しているのは、コンパクトで、レンズアダプターが使えて、レンズがF1.8と明るいことなのである。コンパクトなのは持ち歩くために必要だし、私はなんと言っても超広角デジカメが欲しいのだが、そんなデジカメはないので、ワイドコンバーターを付けたいのでレンズアダプターが必要なのである。明るいレンズの方は、うす暗い中でも撮影する時に重宝しそうなので、少し期待しているのである。
 

 ところで、この位明るいレンズであれば、もう少しぼかすことができるものだろうか?デジカメで写真を撮ってもどうしてもボケない。35mmフィルムを使っているカメラなどと比べるともう全然ボケない。もうほんとにボケない。

 例えば、35mmカメラで135mm F4.5開放のレンズなら、ピントの合ってない背景はこの位はボケる。これは京都の哲学の道近くにある吉田山で撮った写真だ。
 

35mmカメラで撮影した例 135mm F4.5?

 

 ピントが合っている位置以外は光がボケて、キレイなボケが発生する。どちらの写真も絞りは開放で撮影しているので、後ろの風景はほぼ丸くボケている。ぼかせばキレイというわけではないけれど、背景などがごちゃごちゃしている中で対象物だけを浮き上がらせたい場合には、「ボケ」させるととても良い感じになる。
 

 しかし、デジカメではそうそう簡単にボケた画像を撮影することはできない。35mmフィルムに比べて、CCDサイズが小さいからである。35mmカメラよりAPSカメラはもっとぼけなくて、それよりデジカメはさらにボケないのである。そんな様子を見るために、二台目として買ったFinePix4700zで「ボケ」を意識して撮影してみたものが下の写真である。手前の植物にピントが合って、奥の道の先はボケてはいるのだけれど、それでも先程の写真などとは比べものにならないほどわずかしかボケていない。
 

在りし日のFinePix4700zで「ボケ」を意識して撮影してみた写真
(昼過ぎの箱根山中で)

 ところで、このような画像の「ボケ」を考えるとき、「ボケ」た画像をシャープに復元しようという話は非常にポピュラーな話題である。例えば、本「できるかな?」でもこれまでに

といった感じで遊んできた。また、さらには「恋の形」を復元しようとしたとか、このようなアプローチを遥か昔に考えていた漱石の「文学論」を振り返ってみたりしたきたのである。しかし、これらはいずれも「ボケたデータを復元する」という問題であった。

 一方、この逆のアプローチである「シャープなデータをボケたデータにする」という問題も結構ポピュラーである。例えば、音楽をホールやライブハウス風にボケた音にするDSPはかなりの数のオーディオ装置に付けられている。これも、もともとはシャープな音声データが部屋の中でボケていく様子をシミュレートする回路である。また、画像に関する話題でも、ピント位置をずらした複数の画像から任意の「ボケ」画像を作成するといった話題もたまに見かける。

 そこで、「できるかな?」でもデジカメ画像を35mmカメラ風にキレイにぼかすことに挑戦してみることにした。今回は、まずはアルゴリズムを確認して、次回以降で簡単プログラムを作成してみることにしたい。

 まずは、似たようなソフトウェアがあるかどうか、Googleで適当なキーワードを使って検索をかけてみると、IrisFilter(http://www.reiji.net/iris/)というソフトウェアがあった。これは、「写真のぴんぼけを再現する」というフィルターだった。サンプル写真などを見てみると、これがなかなかきれいだった。例えば、早朝の御殿場の路上を「在りし日のFinePix4700z」で撮影した写真にこのフィルタをかけて、「ボケ」を加えてみたのが下の画像である。
 

Iris Filterでデジカメ画像を「ボケ」させたもの
オリジナル画像
Iris Filterで処理したもの

 ここではこんな六角形の絞り形状をを用いてみた。右の処理画像中の、車のテールランプや車の下部を眺めてみると、鋭いハイライト部が六角形に光っているのがわかだろう。確かに、「ボケ」がカメラの絞り形状になっていて、良い感じである。

 WEBページの記載によれば、このIris Filterは「フィルム特性曲線を利用し、レンズから通った光がフィルムを感光させる様子を再現しています」ということである。なんでも、特許も国内・USP共に出願済みということだが、特願2000-100042もU.S.PTO 09/772532も未だ公開にはなっていないようで、残念ながら特許の内容を読むことはできなない。

 このWEBページの記述の中で面白いのは、「データ上の数値をそのまま拡散させる従来のPhotoshopをはじめとした画像処理ソフトと違い、実際のフィルムに当たる光の量(露光量)を逆算し、その露光量をもってピントがずれている様子を再現します」という歌い文句でPhotoshopの「ガウスぼかし」と比較広告してある部分である。

 試しに、先の画像をIris Filterで「ボケ」を加えた画像と、Photoshopの「ガウスぼかし」とで「ボケ」を加えた画像を比較してみると、下の二枚の画像のようになる。確かにIrisFilterの売り文句通り、こうして比較してみるとPhotoshopガウスぼかしが写真の「ボケ」っぽくないのに対して、IrisFilterの「ボケ」が写真のそれっぽいことが良くわかる。
 

Iris Filterの処理画像(左)とPhotoshop ガウスぼかしで処理した画像(右)の比較
Iris Filterで処理したもの
Photoshop ガウスぼかしで処理したもの

 さて、お仕着せのソフトを使ってみるだけではなくて、自分でデジカメ画像をキレイに「ボケ」させてみることにしたい。というわけで、hirax.net風「ボケ」フィルターの動作を考えてみる。

 まずは、毎度のことだがオリジナル画像が「ボケ」る様子を計算する式は

逆フーリエ変換(  フーリエ変換( オリジナル画像 ) x フーリエ変換(ボケ具合 ) )
と表すことができる。詳しくは、「宇宙人はどこにいる?」の回でも読んでもらうことにして、簡単に言えば周波数領域でオリジナル画像とボケ具合を掛け算をしさえすれば良いのである。つまり、今回のデジカメ画像をぼかす場合だったら、
  1. デジカメ画像と「ボケ」具合をそれぞれフーリエ変換し周波数空間に変換
  2. 周波数空間で乗算を行う
  3. 逆フーリエ変換して実空間に戻す
とハイ!「ボケ」画像の出来上がり、というわけである。ボケ具合が小さい場合などは、このやり方よりもずっと計算量の小さいやり方はあるわけだけれど、とりあえずこのやり方はとても単純明解なので今回のように試しでやってみるにはとっても楽な方法なのである。また、ここでいうボケ具合というのは、こんな形状の「ボケ」具合のことである。
 

 じゃぁ、早速やってみようとなるわけだが、その前にもう一つ注意することがある。それは、RGB画像の数値というものは実は元々「明るさを対数変換した値」であるということなのである。人間の目も含めて世の中の大抵の材料は対数的な感度を持っている。例えば、人間の目に「2倍明るい」という場合に、光は「2倍明るい」というわけではない。その場合には指数的にX^2倍明るいのである(ここで、xの値はそれぞれのデバイスによって色々と違う)。その明るさをRGB画像の数値データにする時に、明るさの対数をとってLog[x,X^2]で2という数値として表しているわけだ。

 RGB画像の数値が「明るさを対数変換した値」だというようすの一例を示すと下の図のようになる。
 

RGB画像の数値というものは実は元々「明るさを対数変換した値」である
片対数軸で表した
横軸 = 0〜255の数値データ
縦軸 = エネルギー
線形軸で表した
横軸 = 0〜255の数値データ
縦軸 = エネルギー

 逆に明るさからRGB画像の数値データへの変換グラフは例えばこんな感じである。RGB数値で200と255と言っても実はその明るさは大違いであることがわかると思う。
 

 

 だから、この手の処理を行う際には、まずは指数変換してから処理を行い、そしてその後対数変換してやらなければならないわけだ。もちろん、今回のデジカメ画像をぼかす場合にも、RGB画像の数値をまずは指数変換した後、「ボケ」演算を行って、その演算結果を対数変換でRGB画像の数値に戻してやらなければならないのである。といっても、別に難しい話ではなくて画像を扱う装置だとごく当り前の話だ。

 そう、「ボケ」演算のhirax.net風レシピはたったこれだけ〜というわけで、早速このレシピに従ってhirax.net風デジカメ「ボケ」フィルターをかけてみたのが下の画像である。キレイな「ボケ」画像ができあがっていることが判ると思う。
 

hirax.net風デジカメ「ボケ」フィルター
キレイな「ボケ」画像のできあがり〜

 ところで、デジカメ画像のRGB画像の数値を指数変換したものに「ボケ」演算を行ったわけだけれど、もしRGB画像の数値そのものに対して「ボケ」演算を行ったら、どんな結果になるだろうか?つまり、「データ上の数値をそのまま拡散させる」やり方をしたら、どうなるのだろうか?そこで、試しにRGB画像の数値そのものに対して「ボケ」演算を行ってみるとこんな結果になる。
 

RGB画像の数値そのものに対して「ボケ」演算を行ってみた結果
キレイじゃない…

 何だかボンヤリとにじんだだけの「キレイじゃない」写真になってしまっている。それは、当り前である。本来2倍明るいものはX^2倍明るいわけで、すごく光の量は2倍どころでなく多いわけだ。それが広がる量を仮にRGB数値そのまま2倍として扱ってしまうと、その光の部分は薄暗くなってしまう。コントラストのはっきりしない、ぼんやりとした写真になってしまうわけだ。ちゃんと、X^2倍のデータとして扱ってやらなければならないわけである。

試しに、指数処理したものと線形処理をしたものとを並べてみるとその画像の違いがよくわかるだろう。
 

指数処理した画像(左)と線形処理をした画像(右)の比較
hirax.netレシピの
キレイなボケ画像(指数処理)
 

キレイじゃないボケ画像(線形処理)

 さて、今回はデジカメ画像の「ボケ」フィルターのhirax.net風レシピを確認してみた。次回(と言ってもいつになるか…)以降に、このレシピに従って実際にソフトを作成していこうと思う。
 

 ところで、「文学論」の中で漱石は「ボケ」は焦点的印象又は観念に付随する情緒を意味する、と言っている。それは、言い換えれば「何かの出来事をきっかけとして感じた怒り・悲しみ・喜びなどの感情がボケである」ということだ。そして、さらに言えば、写真で背景をぼかすということは、つまり「背景にある出来事が生みだした怒り・悲しみ・喜びを広く混ぜて包み込む」ということなのである。

 だから、何かを撮影する時に対象物の背景をぼかすということは、「背景にある出来事が生みだした怒り・悲しみ・喜びを広く混ぜて対象物を包み込んで、そして対象物を浮き上がらせる」ということなのかなぁ、とぼんやりと考えてみたりする。そんな写真は対象物を写しこんでいるのと同時に、それを包みこむ背景も写しこんでいるンだろうなぁ、と考えてみたりする。
 

2001-10-11[n年前へ]

NCH Tone Generator Ver.1.2 

PCベース音声波形ジェネレータ。(リンク

2003-07-07[n年前へ]

音程を維持したまま再生速度を変更することもできるメディアプレイヤー「MeRu」 

 音声・動画ファイルの再生速度を変えずに音程を変更したり、音程を維持したまま再生速度を変更できるメディアプレイヤー「MeRu」の記事

2004-05-20[n年前へ]

話速変換技術「ゆっくりトーク」 

 「バッファリングした音声をまずは低速で再生開始し、再生速度を調整し、次の話題に移る前の無音部分で帳尻が合わせる」という話速変換技術「ゆっくりトーク」 from 雑記帖



■Powered by yagm.net