投稿者: 玉井 裕也

  • 実習用オープンデータまとめ

    社会医学の実習で学生が使えそうなオープンデータをまとめることにする。自分で探してみるとなかなか見つからないものである。こういうテーマでデータを探しているという時にもっと簡単に見つかる仕組みがあれば、たぶんもっとオープンデータ(だけの問題では無いけれど)は利用されて、オープンデータの有用性や存在意義が理解されるのではないかなと思った。

    DATA.GO.JP データカタログサイト
    http://www.data.go.jp/

    e-stat 政府統計の総合窓口
    http://www.e-stat.go.jp/

    厚生労働省 統計一覧
    http://www.mhlw.go.jp/toukei/itiran/

    がん登録・集計
    http://ganjoho.jp/reg_stat/

    地域のオープンデータ

    名古屋市 オープンデータ
    http://www.city.nagoya.jp/shisei/category/388-0-0-0-0-0-0-0-0-0.html

    愛知県 オープンデータカタログ
    http://www.pref.aichi.jp/life/7/

    海外のデータ

    DATA.GOV
    https://www.data.gov/

    Healthdata.gov
    http://www.healthdata.gov/

    #オープンデータまとめ

    code for nagoya オープンデータ一覧
    https://github.com/code4nagoya/opendata/wiki/dataset

    随時アップデート予定。こんなのありますよということがあればコメントやメールください。

  • R 入門

    Rの勉強会をすることになった。はじめてRをインストールするところから、なんとか自分で統計解析がひととおりできるようになるまで、がとりあえずの目標である。そこまできたら、あとは自分ひとりでも本やウェブ上の情報をもとに、自分のやりたいデータ解析はできるはずだ。

    とはいっても、私自身、本格的にRと接するようになって2ヶ月…現在進行中で勉強中だ。だからこのページは自分が勉強してこれはいいとおもった入門の方法とサイトの紹介でもある。Rそのものについては私なんかが説明したり説明する資料を作るよりも、もっと良いサイトがウェブ上にいっぱいあるわけだし、そこはウェブ上のプロたちに任せることにする。(このベージは随時アップデートしたい。)

    1. とりあえずインストールするもの

    RとRStudioをインストールするのがスタート地点なので、これがないと始まらない。RもRStudioも最新をインストールする。現時点でR3.3.0。RStudio Desktop Open Source Editionをインストールする。

    https://www.r-project.org/

    https://www.rstudio.com/

    2. 困ったときはとにかく検索
    わからない時はウェブを検索すると、だれかが親切に教えてくれることが多い。

    わからない時はとりあえずググる。ググるとたいていのことはなんとかなる。みつけたらコピペして試してみる。
    https://www.google.co.jp/

    SeekRはR専用のサーチエンジン。Googleでうまく見つからない時はSeekRでググる。
    http://seekr.jp/

    SlideShareにどこかのR勉強会の資料がアップロードされていることがある。かなりマニアな内容が丁寧に解説されていることも多い。
    http://www.slideshare.net/

    3. Rの勉強のために使えるサイト集
    あとは簡単な入門書やウェブ上の解説・入門記事を見ながら、実際にデータを使ってRを触っていけばなんとかなる。うえのほうが本当の入門用の解説で、下のほうは辞書的に使えそうな情報たくさんのサイトなど。

    はじめてのR
    http://www.slideshare.net/m884/japan-r-15432969

    10分で分かるr言語入門ver2.15
    http://www.slideshare.net/akiaki5516/10rver215-15-1010

    R初心者のためのR操作ゼミ
    http://www7.atwiki.jp/hayatoiijima/pages/34.html

    統計ソフトRの使い方
    https://sites.google.com/site/webtextofr/home

    統計ソフトRを使った統計学実習
    https://sites.google.com/site/courseofr/home

    Rによるデータ解析入門
    http://www.biwako.shiga-u.ac.jp/sensei/kumazawa/R/c2.pdf

    統計処理ソフト R 入門 講習会資料
    http://ofmind.net/doc/r-intro-lecture

    Rクックブック付録
    http://www.oreilly.co.jp/pub/9784873115337/r_ckbk_webapp.pdf

    Rの導入とRStudio事始め(改訂版)
    http://www.slideshare.net/TakashiYamane1/rrstudio

    実践! Rで学ぶ統計解析の基礎
    http://www.atmarkit.co.jp/fcoding/index/stat.html

    ggplot2再入門
    http://www.slideshare.net/yutannihilation/ggplot2-53851875

    統計用言語Rの使い方(2014)
    http://www.slideshare.net/ssuser29c971/r-34927385

    Rオンラインガイド
    http://psycho.edu.yamaguchi-u.ac.jp/?page_id=242

    ドットインストール R言語入門
    http://dotinstall.com/lessons/basic_r

    保健・医療研究の進め方入門 —R と EZR を用いて—
    http://minato.sip21c.org/ebhc-text.pdf

    R、R言語、R環境・・・・・・
    http://mjin.doshisha.ac.jp/R/

    R-Tips
    http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html

    無料統計ソフトRで心理学
    http://blue.zero.jp/yokumura/R.html

    租界〈R〉の門前にて —— 統計言語「R」との極私的格闘記録
    http://cse.naro.affrc.go.jp/minaka/R/R-top.html

    続・わしの頁
    http://nfunao.web.fc2.com/

    私が使ってみてよかったという本についてはまたあらためてまとめるつもり。
    まだまだあると思うので、(私も探しているので)、おすすめサイトなどありましたら教えてください。

  • 米屋の手づくりおにぎり多司

    onigiri

    名古屋市立大学の近所で、桜山の交差点にあるおにぎり屋である。おにぎりそのものはふんわりとしていて美味しいし、おにぎり一つのボリューム満点で値段も安いので、気に入っている。けっこう人気のようで、お店の前にはいつも客がいる。このおにぎり屋、どうやらチェーン店のようで、「多司」は「たし」と読むらしい。

    onigiri

    onigiri

    はじめてこのお店にいったとき、お腹が空いていたこともあって4個買ったのだけど、全部は食べきれなかった。大きさはコンビニのおにぎりの1.5倍か2倍はあると思う。

    関連ランキング:おにぎり | 桜山駅御器所駅

  • イヤマー現象

    井山裕太7冠が誕生した。まさか七大タイトルすべてを同時に保持するなんてことはないだろうとずっと思っていた。ちょうど20年前に羽生善治7冠が誕生したのだけど、そのころは安室奈美恵が大人気だった。私が中学生から高校生になった頃だったけど、アムロの真似をした人が岐阜ですら見かけることがあって、アムラー現象って(言葉を知ったのは後からだったかもしれないけれど)凄いことだなと思った。

    そういえば7冠のころ羽生善治はテレビにもよく出てきて、ものすごい盛り上がりでフィーバーだったと今でも思う。井山七冠にもそれぐらいの盛り上がりはあるのだろうか。あってほしいと期待はしているのだけど、いまのところはそれほどではないように感じる。羽生善治は寝ぐせのあるまま対局場に現れたりとかそういうことをしていた。井山裕太にはそういう話は聞いたことはない。当時私もよく見ていたNHKの朝の連続テレビ小説「ふたりっ子」には、現役の将棋のプロ棋士もよく出ていたのだけど、羽生善治はそこに羽生善治名人役で出ていた。井山裕太にもそういう機会はあるのだろうか。イヤマー現象を巻き起こして欲しいと強く思う。

  • Python と R のインストール on Windows 7

    大学のPCでのデータ解析のための環境を整えている。とりあえず必要なのはPythonとRである。プライベートで使っているのはMacなのだけど、今回はWindows7ということで、前もってちょっと調べた。調べたけれど、結局はMacと同じでいけそうだという結論になった。

    PythonはWindowsでもMacの時と同じく、Anacondaをインストールするのが良さそうである。Minicondaという最小限のパッケージだけをインストールする人もいるのだろうけど、私の場合は、あとからいろいろ考えてインストールするのも面倒なことだし、まとめてインストールするほうがトラブルも少なそうな気分的な安心感もあって、Anacondaにしている。Anaconda cloud とか Anaconda Navigator とか Spyder なども一緒にまとめてインストールされたみたいで、どういうものなのかまだわからないのだけど、便利そうな気もするのでこれからちょっとづつ試してみたい。

    Jupyterも無事にインストールされていた。はじめはlocalhostにうまく接続できなくて困ったのだけど、プロキシの問題だったみたいでその問題は解決できた。これでいつもどおりできそうなので一安心だ。

    Rは、結局いつものように、R + RStudioの組み合わせで使うことにした。みんなこの組み合わせでやってるし、私もこれが一番やりやすいと思う。

    Conda for Rという記事も見つけたので、そちらでも一応インストールしてみた。これでJupyterでもRができるのだろう。RとR-essentialsというパッケージの詰め合わせがインストールされたみたいだ。そうは言っても、Rstudioの設定などもよくわからないので、とりあえずはCondaのほうはメインではさわらないでいこうと思う。Conda用のRのパッケージというものがあるのだろうか、となるとすべてが揃っているわけでもないようだし、しばらくは様子見かなと思う。

    コマンドプロンプトで日本語が文字化けするのがちょっとまだ未解決なのだけど、いまのところはそれ以外は特に問題なくできている。わりと順調だと思う。