Rを使ったデータ分析手法-めっちゃクロス集計する

2015/11/07 14:00

クロス集計ならExcelでええやん、は間違いビジネス活用事例で学ぶ データサイエンス入門の第四章では、Rでクロス集計を行う方法が紹介されています。 クロス集計と言えば、Excelの独壇場でしょう!という気持ちになりますし、実際クロス集計を作成した後、そこから色々分析することに関してはExcelは悪いツールとは言えないでしょう。 しかし、クロス集計を切り口を変えて大量に作成する、となると途端にExcelは作業効率の悪いツールと化してしまうでしょう。 クロス集計には、デ..

続きを読む

Rを使ったデータ分析手法-ヒストグラムからデータを解析する

2015/10/24 15:55

Rを学ぶと効率が向上する今回学習するのは、ビジネス活用事例で学ぶ データサイエンス入門の第三章の内容です。ヒストグラムの分析であればTableauが使えるのであれば、そちらの方が良いと思うのですが、どんな会社でも大体使えるであろうデータ分析ツールとして思い浮かぶのはExcelとRぐらいなものです。Excelの方が習熟は容易ですが、少し頑張って習熟すれば大体の分析はRでやる方が圧倒的に早い(し、早いが故に様々な角度から分析出来る)ので、Rを用いた分析手法を身に着けたいところ..

続きを読む

データ分析って言っても何をしたらいいのか解らないあなたに『ビジネス活用事例で学ぶ データサイエンス入門』

2015/10/18 12:07

データ分析を任されたけど何をしたら良いか解らないデータサイエンティストというと、機械学習や複雑なモデリングを駆使してバリバリに理論も実装もこなすイメージがあります。しかし、現実にデータ分析に携わる人というのは、必ずしもそうした理論も実装もバリバリの人だけではありません。エクセルでグラフをこねくり回してウンウン唸った挙句「えいやっ!」と明確な根拠もなく結論を出している、そんな人も多いでしょう。 そうゆう状態で分析をしていると、そのことに慣れきって精神が麻痺していくか、あま..

続きを読む

別のクエリ結果に基いてデータを絞り込むサブクエリ(副問い合わせ)『書き込み式SQLのドリル 改訂新版』2-5

2015/09/28 18:38

データの比較が面倒だからクエリ一発で出したい!今回は書き込み式SQLのドリル 改訂新版の2-5で解説されているサブクエリに関する話をしようと思います。 実のところ、サブクエリでやれることは一旦別々のクエリでデータを抽出し、それらをExcelやTableauなどのBIツールを組み合わせて加工してやればどうにか出来るので、知っていないと分析用のデータセットを作れないという類のものではありません。 しかし、SQLを複数書いて、別々の出力データを操作して本来欲しいデータセット..

続きを読む

複数のテーブルを結合してデータを取得する 『書き込み式SQLのドリル 改訂新版』2-1 ~ 2-4

2015/09/12 08:48

実運用では単一テーブルからのデータで事足りることはほぼありません書き込み式SQLのドリル 改訂新版の一章では、SQLの基本的な書き方について学習しました。 それらを用いて実践的なクエリの書き方を学ぶというのが二章の主眼になります。 そんなわけで、今回は実践的なクエリを書く上で絶対に必要になるテーブル結合の概念について学びます。 なお、テーブルに別名をつけて書くことについて、2-3の自己結合についての項目で書かれていますが、全てのテーブル結合の際に別名をつけ、列名の指..

続きを読む

データを集計する 『書き込み式SQLのドリル 改訂新版』

2015/09/07 18:55

データを集計して抽出するちょっとデータを見たい人にとっては、データをそのまま抽出した後で、そのファイルをエクセルやBIツールで集計すれば良いため、最悪、使えなくてもどうにかなることが多いでしょう。 ただし、クエリでデータの集計を行うことが出来れば、毎回エクセルでピポットテーブルを行う、みたいな作業をしなくて済むため、労力をかなり減らすことが出来ます。また、ちょっと複雑なデータ抽出をしたいと思った時に抽出できるデータの幅が大きく広がるので、この項をマスターしておくとストレ..

続きを読む

もっと見る