1. HOME
  2. ブログ
  3. IT技術
  4. SQLとpandasで同じ操作をする方法

SQLとpandasで同じ操作をする方法

はじめに

業務でSQLとpandasを使う機会があり、両者で同じ操作をする際の基本的な構文の使い方を整理していきたいと思います。

pandasは、pythonのデータ解析ライブラリで具体的には下記のようなことが出来ます。

  • csvやexcelなど様々な形式のファイルの入出力
  • データの処理(欠損値処理・結合・ピボット・抽出)
  • データの簡単なグラフ化

pandasにはデータフレームなどの独自のデータ構造があり、表形式のデータをSQLのように高速かつ、簡単に操作することが出来ます。

それでは、仮のテーブル名は「sample」として、SQL・pandasの順にコードを記述していきます。

基本的な操作

基本的な操作をささっと紹介していきます!

列選択

列追加

列名変更

条件抽出(WHERE句)

複数条件抽出

並び替え(ORDER BY句)

グループ化・条件分岐の操作

グループ化(GROUP BY)

pandasでgroupby を使うと、デフォルトでグループラベルが index になります。

index にしたく無い場合は as_index=False を指定するか

グループ化した後にreset_index()をしましょう

条件分岐(CASE WHEN)

複数条件分岐(CASE WHEN)

lamda関数を使って記述することも出来ますが、複数条件の場合は関数を作った方が楽な場合が多いです。

テーブル結合の操作

内部結合(INNER JOIN)

左結合(LEFT JOIN)

right joinの場合は how="right"にします。

外部結合(OUTER JOIN)

書いた人はこんな人

あだっちー(エンジニア)
あだっちー(エンジニア)
8月から入社しました。安達です。
前職ではメカ設計・生産技術の業務をしておりました。
趣味はスノボとキャンプです!
日々邁進して参りますのでよろしくお願いいたします!

関連記事

採用情報

\ あの有名サービスに参画!? /

バックエンドエンジニア

\ クリエイティブの最前線 /

フロントエンドエンジニア

\ 世界を変える…! /

Androidエンジニア

\ みんなが使うアプリを創る /

iOSエンジニア