データサイエンティストのひよこ

分析に関する日々の相談事項

2018-01-01から1年間の記事一覧

ネットワークとは

ネットワーク解析に興味を持ったか、必要になって調べてきたかのどちらかだろうと思う。興味をもってくれたことはうれしいし、ネットワーク解析が必要になるような分析が実務の技術者の間にも広まってきたこともうれしい。 ネットワーク解析は、関係性データ…

ページランクと被リンク数

ページランクとは ページランク(PageRank)とは、Google検索エンジンで利用されているWebサイトの評価指数のことである。評価方法やそのビジネス利用において、Google創業者であるセルゲイ・ブリン、ラリー・ページが大学院在学中に開発したものであって、G…

統計モデリング・物理モデリング

モデルを作る モデリングについても、よく質問される。私が物理出身なので、私が言うモデルと統計に詳しい人のモデルの意味合いが少し異なるときがあり、齟齬が発生するようだ。 自分でもたまに説明に失敗することがあるので、自分のためにまとめておきたい*…

ビッグデータ分析とは

ビッグデータ分析で私の関わったこと 私は、ビッグデータ分析を専門としていた情報科学科の助教だった。細かい専門分野の名前を出すと、複雑系およびネットワーク解析の研究をしていた。 図:Phys. Rev. E 91, 042815複雑系出身のデータサイエンティストは、…

データサイエンティストの業務

データサイエンティストの業務ってなんだろ おそらく、データサイエンティストのブログにでもいけば、必ずこのテーマで記事があるんじゃないかというぐらい、ありふれた話題だ。自分も含めて、データサイエンティストがよく自問自答している。データサイエン…

データのサンプル数について考え方

「サンプル数っていくつあればいいですか?」ってほんとよく質問される。私の場合は、このサンプル数が適切ですというアドバイスに加えて、現状のサンプル数ではこういう分析してくださいというアドバイスをしている。特に後者の指針を与えている情報が、い…