実体と情報のはざま

何事にも囚われず。

熱海&伊東へ小旅行 シャボテン公園

 子供たちはもちろんのことサラリーマンのである私も夏季休暇となり、ちょっとだけ熱海&伊東の周辺に2泊3日で旅行に行ってきました~。自宅は横浜なのでそんなに遠くではないけれど、都会の喧騒から離れてリフレッシュするにはいいところなんです。

 一日目の熱海で宿泊したホテルは会社の保養所なのでよく利用している。こういうところって、ちょっと古いけど何処に何があるかよく分かっているし居心地がよい。熱海でファミリーが楽しめる観光名所は見当たらないので、いつもはプールとか熱海港で釣りを楽しんだりする。

 ただ今回は、少し足をのばして箱根小涌園ユネッサンという温泉のようなプールのようなところに行ってきた。数年前にも来たことがあったがあんまり変わってない印象。変わっていないということは施設をキレイに維持している従業員さんが頑張っていることなのだろうけど。唯一変わったのは客層かな。ファミリーとカップルが主体であることに変わりはないのだが、高校生か大学生くらいの女の子が4~5人で自撮りしまくっている様子が目についた。最近よくきく”インスタ映えする”ということなのだろうか。ガリガリ君風呂なんかはひっきりなしに自撮り集団が楽しんでいた。。

 二日目の伊東では一般のホテル(旅館?)に宿泊した。ここではアノの日本にしかないであろうサービスには困惑した。そう、夕食から帰ってきたら布団が敷いてあるパターン。。これって、まったく知らない人(スタッフ)が開いている荷物とかをさわるわけだし、もう完全に時代に合わなくなっていると思う。久しぶりにこの体験を味わってみて、ちょっと愕然とした。

 伊東での観光は、シャボテン公園に行ってみた。あいにくの濃霧ですっきりとした写真は撮れなかったものの、動物たちがみんなかわいくって癒されました。

クジャク。霧のせいかそっけない感じ。羽を広げてほしかったな。↓

f:id:myuteru:20170813220640j:plain

シャボテン。園児の息子が怖がったため早足で通過。。↓

f:id:myuteru:20170813220805j:plain

 と、いう感じでファミリーで楽しく過ごせました~。ダイエット中にもかかわらず、ホテルのバイキングで食べまくってしまったので、ちょっと太ったかも。。

 2日ぶりに帰宅したら、あばしゴーヤーがりっぱなサイズに育っていたのでまたゴーヤーチャンプルにしていただきました。まだ5個くらい小さい実がなっているので楽しみ。一本の苗からこんな立派な実が沢山採れるとは。来年も育てる候補にランクイン。↓

f:id:myuteru:20170813220959j:plain

 ミニトマトは残念ながら失速してしまい、枯れかかっている。。バジルは元気いっぱい育っているものの、子供の口には合わないようでまだ料理にはあまり活用されてない。ピザにのせたら食べてくれるかな~。

 今日はここまで!

あばしゴーヤーの実が次々と

 先日アップした家庭菜園のあばしゴーヤーが順調に実をつけている。本日収穫したものはこちら↓

f:id:myuteru:20170730212458j:plain

 2本同時に15cm程度に育ったので、我が家のゴーヤーだけで妻にチャンプルーにしてもらい夕食にいただきました。市販のものと比較しても全く遜色ななく、とってもおいしかった~。次の実も育ってきているし、まだまだ楽しめそう。実よりも葉っぱの匂いがすごくて、何とも言えない野性的な匂いに癒される~。

 最近、色々忙しく、ブログ更新できてないな~。。今日は園児の息子の相撲大会やら横浜市長選挙やらなにかと動きまわった。今回の市長選は横浜市にとって大きな決断だと思う。横浜にカジノができてしまうのか?

 もはや、データサイエンスのブログではなくなってきたな。サブタイトルを変えようかな。。

今日は、ここまで~。

癒しの家庭菜園 やっとゴーヤの雌花が出るように!

 体調を崩してから少し時間はかかったが、完全回復した。いやはや、きつかった。最近は、何か癒されるものをそばに置いておきたいとおもうようになった。自分にとって何がいいか、よーく考えてみたけど、巡り廻ってすでにあるものに戻ってきてしまった。子供たち・家庭菜園・物理やデータサイエンスの本・・・必要なのは、これらを味わう若しくは鑑賞する時間だけだったということかな。

 我が家はマンションなので、家庭菜園といっても超小サイズのプランタ。ミニトマト、あばしゴーヤ、バジル、だけです。これだけでも、ちゃんとお世話をするとなると毎日やることあるし、収穫も楽しい。金銭的な元がとれるとかでは全くないけど、癒しの効果はプライスレス。

 特に、ここ数日でやっとゴーヤの雌花が出てきてくれて嬉しい。雄花ばかりで全く雌花が見当たらなかったが、気温が上がってくると雌花が出てくるらしく、ちらほら小さな実が見られるようになってきた。癒される~。

f:id:myuteru:20170712104609j:plain

↓これが雄花。毎日咲きまくる。当然、実はできず。

f:id:myuteru:20170712104620j:plain

ミニトマト、先日の強風に耐え忍び、大きな実に成長。

f:id:myuteru:20170712104632j:plain

↓バジル。妻が種から育てている。葉が元気でこんもりしてきた。

f:id:myuteru:20170712104638j:plain

 というわけで、今日も我が家の家庭菜園に癒された~。

今日はここまで!

プログラミングと仕事と育児で睡眠不足。体調不良に。。

 ここ数か月、睡眠時間を削ってデータサイエンスの勉強をひたすらやってきた。さらに、本業の仕事が忙しくなってきた。さらにさらに、園児の息子が夜中に熱を出してほとんど2日寝なかった。結構大丈夫なもんだな~と思っていたが甘かった。。40代半ばの身体は徐々に疲労がたまって、ついに思いっきりグダグダになってしまった。症状を言葉にするのは難しいが、特徴的なのは強烈な眠気が突然襲ってきて気絶するように一瞬眠ってしまう。2~3秒後にふと気づくとパソコンにはキーボードを連打したあとが・・・。そんな感じが5日は続いた。寝ても回復しなかった。一番酷いときには歩けないほど眠かった。もしこのとき車を運転していたら・・・あー恐ろしい。。

 というわけで、今後は睡眠時間を優先することにした。データサイエンスの勉強は続けるが、ペースを落とさざるを得ない。ずいぶん前に買った本に書かれていることが身に染みた。下の本。あらためて、今後はエッセンシャリズムを実践していきたいと思う。

 その時々で重要なことだけに集中すべし!仕事が忙しかったらデータサイエンスの勉強は一旦停止。息子が熱出したら、仕事は行くけど最小限にとどめてデータサイエンスは一旦停止。仕事が忙しくなく、息子も元気なら、データサイエンスに集中する。

ランダムフォレストのトレーニング部分まで

 めちゃくちゃ時間がかかってしまったが、ランダムフォレストのプログラムが一応完成した。しかし、まだトレーニング(学習)の部分だけ。。いつものようにPythonで書いたのだが、バグにかなり苦しんだ。いつもは紙と鉛筆でプログラミングの前段階までとことん煮詰めるのが自分流なのだが、ランダムフォレストに関してはプログラミングしながら試行錯誤せざるを得なかった。たぶん、フォレストを数式で扱うのが難しいからだと思う。他とは違う何かがある。そこが面白い!
 今回もプログラムはライブラリを使わないで書いた。scikit-learnにランダムフォレストがあるとのことで、私が以前紹介した本ではそれを使っている。なのでコーディング自体は著作権やらは気にしないでコピペできるのだが、コーディングがヘタなせいか非常に長くなってしまったので結果だけのせておく。トレーニング部分しかなくて何かアウトプットが出せるのかって?実は私が目指していたのはテスト部分(機械学習)ではなく、このトレーニング部分にある。ここから、特徴量の重要度が出したかったのだ!何が重要な特徴量かを知る術を持っておけば様々な問題に対応できると思って。以前、身につけた主成分分析(PCA)とは違う観点で特徴量を見ることができるかなと。
 で、今回の結果がこれ。Irisデータセットを使って特徴量の重要度を算出した。以前紹介した手持ちの本(パターン認識のやつ)とは使っている”不純度”の関数が違うから単純比較はできないが、傾向は同じで一安心。ちなみに、本ではジニ係数を用いていて、私はエントロピーを用いた。
f:id:myuteru:20170705013836p:plain
 計算設定は、木の数は500本で深さは1にした。深さを深くしても大差なかった。木の本数は100本ぐらいだと算出毎のブレが若干あった。10本だと結構ブレた。計算が一瞬で終わるのは嬉しいけど。
 次回はテスト(機械学習)部分も完成させたいと思う。そのあとは、いよいよKaggleに挑戦してみようかな。どうかな。あ、また深夜になってもーた。。
今日はここまで!

ランダムフォレストを勉強中!

 ランダムフォレスト、なかなか手強い。一週間くらいかけて今日やっとアルゴリズムを理解したところ。目標では今日あたりにプログラム第一弾が完成しているはずだったのに、何回も立ち止まってしまった。。ネットで拾った英語の論文の解読にも苦労した。これは単なる遠回りだったのだが。今日は、複数の参考資料から得たアルゴリズムと関連情報を自分なりの解釈で書き下しておきたいと思う。

設定:深さDの決定木をT本使う。

①トレーニング

・N個あるトレーニングデータからそれぞれの決定木に対して、n個のサンプルをランダムに非復元抽出する。

・決定木の各ノードtで、P個ある特徴量のうちP'個をランダムに非復元抽する。P'=√Pがちょうど良いかも。

・この中で情報利得が最大になる特徴量とその閾値を選択する。これがランダムフォレストにおける”学習”。(情報利得とは、データを分割する前後における”不純度”の差分のこと。”不純度”とは、情報エントロピージニ係数と呼ばれる値。)

・決定木が深さDまで達するか不純度がゼロになったら木の成長を止める。(テストでは、木の各末端ノードで入力されたデータがどのクラスに属するか判断する。)

②テスト

・あるテストデータを全ての決定木に投入し、個々の木にこのデータがどのクラスに属するか判断させる。最後は多数決で決定する。

 アルゴリズムはざっくりこんな感じの理解でいいかな。あとは、プログラミング作業なのだが、for文if文をどう回すか、データのソートが必要かといったイメージは全然できていない。。Numpyで効率的にやりたいがどうなるだろ。最近仕事が忙しいけど、3日後にはできるかな。

 最後に参考文献で一番役に立った本を紹介。別件で買って本棚に埋もれていたが、あらためてこの丁寧な解説に感謝したい。データサイエンスではしばしば出てくるアルゴリズムの基礎はこれで勉強すると効率が良いと思う。

 Irisデータセットを使っているのもいいね!

 今日はここまで!

炭酸水でダイエット!

 ここ数か月間、データサイエンスにのめりこんで運動らしい運動はしていない。週末は園児の息子と公園でサッカーなどはするが、平日は仕事でもデスクワーク中心で外出などはなし。そんな状況でも、最近取り組んでいるダイエットで成果が出始めてきたので書き残しておく。

 そもそもなぜ痩せなくてはならないのかというと、会社の健康診断で血中脂質が高いという結果がでてしまったことがきっかけ。会社に行けと言われて医療機関を訪れたところ「まずは体重を5%落とすこと。」と言われた。さらに、「痩せられないなら薬を飲み続けなければね。」とも言われショック大。

 そんなわけでダイエットをすることになったのだが、今回はじめて取り組んだのではなく、いろいろ過去に失敗してきた。まず、私のダイエット挑戦歴をふりかえってみた。

・筋トレ → 2日坊主。さらに動いた分食べてしまう。

・ランニング → 1か月程続いたが痩せず。動いた分食べちゃう。

・ロングブレスダイエット → 1か月程で痩せなかったが腰痛には効いた

・納豆をたくさん食べる→ ガセネタだったらしい

・低GI値ダイエット → 1か月程続け若干効果あったが、妻が大変。ニンジンやジャガイモを使わないメニューとか考えるの大変。

黒酢ダイエット → 1か月程続けたが痩せず。酸っぱかった~。。

 ここにデータサイエンスの出る幕はないのだが、”分類”するとすれば、ダイエットとは、「摂取カロリーを減らすこと」「消費カロリーを増やすこと」に分けられる。上記戦歴と自分の特性を加味して私なりに考えたポイントは「摂取カロリーを減らすことに注力する」である。消費カロリーを増やすというのは、総じてお金がかかるし努力も時間も必要なものばかり。だから私の場合、続かない。一方、摂取カロリーを減らすのはただ「あんまり食べなければいい。」というシンプルな努力だけでよい。

 確かに、あれを食べろこれを食べろという現代社会における広告たちの攻撃に対してすまし顔でいられるわけがない。ケンタもマックも大好きだ。しかし、食べることが悪いわけではなく「食べる量が多すぎる。」ことが悪いのだ。日常の消費カロリーがたいして変動しないのだから、これにふさわしい摂取カロリー制限をしていけば、おのずと体重は減っていくはずである。

 ここで登場するのが、”夕食時に炭酸水”である。食べ過ぎているのは主に夕食だと思う。普通、朝食も昼食もゆっくり食べていられないし、仕事などで食べたものが消費されていく可能性も高い。これらに対して、夕食というのは時間的な余裕があるし、その後に運動することもまれである。なので、食後の消費カロリーの割りに多く摂取してしまうことになりやすい。しかし、”夕食時に炭酸水”を飲むことで満腹感が得られる上に、泡の刺激による満足感も得られる。

 その結果、この「”夕食時に炭酸水”で満足感と満腹感」ダイエットにより、2か月で体重7kg減の成果を得ることができた。今も毎日続けている。お金が大変?炭酸水は安い時にスーパーで箱買いするのでペットボトル1本あたり70円弱。他のダイエットに比べれば大したことないと思う。10年くらいず~と82kg前後だったけど今75kgあたり。嬉しい。

 以前はダイエット効果は得られなかったけど腰痛には効果があったロングブレスダイエット。日常に取り入れやすいのでダイエット効果も期待しつつまた始めてみようかなと考えている。こんどはもっと続けられますように…。

 今日はここまで!