/// BANGBOO BLOG /// From 2021-02-01 To 2021-02-28

個人情報や機微情報を隠す
BigQuery の行レベルのセキュリティの概要 | Google Cloud
行レベルなら同じテーブルを使うので同じダッシュボード/Appが使える（AuthorizedViewの方が柔軟だが）
データマスキングの概要 | BigQuery | Google Cloud
列レベルアクセス権以外にもマスクの種類があり、ハッシュだったり先頭4文字や末尾４文字等で共通文字化としてマスク化できる

列レベルのアクセス制御の概要 | BigQuery | Google Cloud

列レベルのアクセス制御によるアクセス制限 | BigQuery | Google Cloud

BQ画面＞左ナビのポリシータグ

　ポリシータグを作成（組織単位で一括一覧表示）

　　タグは階層化できるので、全ユーザタグ＞管理者タグ＞社長タグ

　スキーマ＞Addポリシータグ

　　タグが付いていればプレビューで見れない

　　select * except(tag_column)にする必要がある

　　メタデータは見れる（カラム名、型

　ポリシータグ画面＞対象ポリシー選択＞情報パネルで権限者一覧

　　fine-grained readerを付与するとselect *ができるようになる

　　　社長タグに社長だけ権限付ける等

※APIを有効にし、ポリシーを有効にする必要がある

■承認済みビュー authorized view

authorized viewを設定するとそのviewを対象とする権限だけ必要で権限をさかのぼり付与しなくていい（通常のviewは参照元の権限も必要）

　この権限移譲は閲覧権限のみで編集権限等は含まない

BigQueryの承認済みビュー設定方法 - Qiita

被参照の元テーブル側に許可するview名を設定する
　参照権限は緩くなるが、編集権限は厳しくなる（設定するビューは変更しない前提で承認する形）

authorized viewを付与すると玄関となったビューはdataEditorではビュー更新ができなくなる
　ソーステーブルにもdataOwnerが必要（通常のビュー作成にはdataViewerがソースに必要）
　基本の安全策はauthorized view設定を外す＞ビュー変更＞AV再設定がいい

　　対象のAVは管理者を立て一元管理するのが良さそう

　　（テーブルやビューを作って権限付与してバッチだとdata ownerが必要なのは注意）

■Authorized系にはメリットとデメリット

１) Authorized viewを設定するメリット

一度設定してしまえばソース側への権限付与依頼が不要となりビューの権限管理が省力化できる

ビューにて閲覧対象を絞ることができソース全体は閲覧させないことができる、絞れる
　普通のビューは元データへの権限が必要で見せたくないデータへも権限が必要になる場合がある
２) Authorized viewを設定するデメリット

一度設定してしまえばソース側での権限付与依頼が不要となり被参照側で許可不許可の判断ができなくなる、誰にデータ閲覧権限を付与しているか把握できず管理が機能しなくなる一面がある

将来に置かれるソース側のデータの閲覧も許可することになり不用意に閲覧が可能となってしまう

terraformでAuthorized view設定が剥がれてしまう危険性

ビューを編集するにあたりAuthorized viewを外す必要がある、あるいはソースにもEditor権限
　すぐにビューを変更することができなくなる（ビューを一旦削除することはできる）

Authorized viewはビューを削除して、再度作り直すと生きている場合がある、ダメな場合も多いが

　これで漏洩させたくない情報を一時含められる危険性がある

３）authorized datasetを設定するデメリット
設定時は良いかもしれないが、将来的に意図しないデータがDS入った場合も閲覧を許してしまう
↓
データセットは細かく作成してアクセスレベル設定し普通のビューを使う
ソース全体を閲覧させられない場合(直接権限を付与できない場合)にAVを使うメリットがでる
　情報漏洩リスクはどちらも多段ビューで同じ感じ、だがビュー作成でAV設定が生きているバグがデカい

■BQクリーンルーム

データ準備側でパブリックし、使う側でサブスクする (BQ exploreでペインでAddする)

スプシ保存できない、開覧数のレポートが見れる(使用者名は見えない) 実はパブ側でサブスクし公開すれば、閲覧とJobUserだけで使用できるようになる

GAでなく、またオンデマンドしか無理、コピペやデータコネクタは可能で残念

■ロール割り当て者の出力
カスタムロールのProject_Admin、Project_Managerが誰に割り当てられているか

Asset inventoryをBQにダンプしたデータからクエリする
WITH

projects AS (

SELECT

resource.data AS rsc,

ancestor_path

FROM

prj.cloud_asset_inventory.cloud_asset_inventory_org_resource_now

WHERE

asset_type = 'cloudresourcemanager.googleapis.com/Project'

projects_info AS (

SELECT

JSON_EXTRACT_SCALAR(rsc, '$.projectId') AS projectid,

JSON_EXTRACT_SCALAR(rsc, '$.lifecycleState') AS lifecycleState,

ancestor_path

FROM

projects

projects_efficient AS (

SELECT

FROM

projects_info

WHERE

NOT REGEXP_CONTAINS(ancestor_path, "folders/apps-script")

projects_num_adm_mgr AS (

SELECT

REPLACE(name, '//cloudresourcemanager.googleapis.com/projects/', '') AS project_num,

REPLACE(b.role, 'organizations/1234567/roles/', '') AS role_value,

STRING_AGG(REPLACE(m, 'user:', ''), ', ') AS member_value

FROM

prj.cloud_asset_inventory.cloud_asset_inventory_org_iam_policy_now,

UNNEST(iam_policy.bindings) AS b,

UNNEST(b.members) AS m

WHERE

asset_type = 'cloudresourcemanager.googleapis.com/Project'

AND (role LIKE '%Project_Admin%' OR role LIKE '%Project_Manager%')

GROUP BY

project_num,

role_value

projects_adm_mgr AS (

SELECT

JSON_EXTRACT_SCALAR(resource.data, '$.projectId') AS project,

projects_num_adm_mgr.role_value,

projects_num_adm_mgr.member_value

FROM

projects_num_adm_mgr

LEFT JOIN

prj.cloud_asset_inventory.cloud_asset_inventory_org_resource_now AS res

projects_num_adm_mgr.project_num = REPLACE(res.name, '//cloudresourcemanager.googleapis.com/projects/', '')

)

SELECT

projects_efficient.projectid,

projects_efficient.lifecycleState,

CONCAT(projects_efficient.projectid, ', ', projects_adm_mgr.role_value) AS role_value,

projects_adm_mgr.member_value

FROM

projects_efficient

LEFT OUTER JOIN

projects_adm_mgr

projects_efficient.projectid = projects_adm_mgr.project

ORDER BY

lifecycleState DESC,

projectid;

■BigQuery DataFrames + Geminiでデータ分析

from google.cloud import bigquery

from google.generativeai import GenerativeModel

bq_client = bigquery.Client()

# クエリ実行してDataFrame取得

query = "SELECT customer_review FROM `my_project.my_dataset.reviews` LIMIT 10"

df = bq_client.query(query).to_dataframe()

# Geminiモデルの準備

model = GenerativeModel("gemini-pro")

summaries = []

for review in df["customer_review"]:

response = model.generate_content(f"次のレビューを要約してください: {review}")

summaries.append(response.candidates[0].text) # 修正: 正しくレスポンスを取得

# DataFrameに要約を追加

df["summary"] = summaries

table_id = "my_project.my_dataset.review_summaries"

job = bq_client.load_table_from_dataframe(df, table_id)

job.result()

print("データをBigQueryに保存しました！")

■BigQuery ML (bqml_llm_infer) + Geminiで感情分析

from google.cloud import bigquery

bq_client = bigquery.Client()

# クエリ実行してDataFrame取得

query = """

SELECT

bqml_llm_infer(

model_name => 'my_project.my_dataset.gemini_model',

prompt => CONCAT('このレビューの感情分析をしてください: ', customer_review)

) AS sentiment_analysis

FROM `my_project.my_dataset.reviews`

LIMIT 10

"""

df = bq_client.query(query).to_dataframe()

print(df)

■IAM(Identity and Access Management)

/// BANGBOO BLOG /// - GCP

前回
/// BANGBOO BLOG /// - BigQuery

Posted by funa : 12:00 AM | Web | Comment (0) | Trackback (0)

February 21, 2021

BigQuery

■Big queryリファレンス

BigQuery: クラウドデータウェアハウス | Google Cloud（チュートリアルみたいな）　

BigQuery解説：https://beyondjapan.com/blog/2016/03/what-is-bigquery/

クエリ処理のツリーアーキテクチャによる分散並列処理

複数のサーバーに対してツリー状に拡がっていき、並列にサーバー上で同時に分散処理

　ルートサーバ＞intermediateサーバ＞leafサーバ

BigQuery MLという機能を利用すると、機械学習モデルをCloud AI PlatformのTensorFlowなどに連携させ、クエリ結果を素早くAIと連携

Lookerというデータ分析プラットフォームとの連携よりクエリ結果を、データ統合、変換、分析、可視化、レポーティングすることができ、非常に強力なBI

列指向型・カラム型データベース・カラムナストレージ（一般的なRDBMSでは行単位でデータが保存）

　必要なカラムのデータを取得するだけでよく、またデータは圧縮できる

https://dev.classmethod.jp/articles/google-bigquery-debut/

GCPプロジェクト＞データセット＞テーブル（行row列columnで普通のテーブル、ネイティブbigqueryテーブル/Googleドライブのような外部テーブル、SQLクエリによるビュー）
　アンスコ_で始まるデータセット名は隠しでコンソールで非表示

ジョブは非同期で実行され、ステータスをポーリング（データの読み込み、データのエクスポート、データのクエリ、データのコピーなど）

クエリ（ウェブ UI、bq コマンド、BigQuery REST APIの方法がある、SQLと同じ？

SELECT title, answer_count, view_count

FROM `bigquery-public-data.stackoverflow.posts_questions`

ORDER BY view_count DESC　LIMIT 10

BigQueryはSELECT tag, time FROM [dataset_name.table_name_20151206]のように必要な列だけを選択した場合にはスキャンの幅を狭めることは可能ですが、LIMITやWHERE句には何を書いてもテーブルをフルスキャンしてしまう

節約　Amaのs3に入れRedshift内でテーブルを分割した後にBigQuery

Hadoopでも使われていたGoogle開発のエンジンであるMapReduceは、非構造化データをプログラミングモデルを通して扱うが、巨大なテーブルの結合や巨大な出力結果のエクスポートも可能である半面、処理時間は数分間から数日に及んだ、だが、BigQueryは、あらかじめデータを構造化してBigQueryのテーブルに格納しておかねばならないが、ほとんどのクエリは数秒で完了する

サードパーティツール（データの読み込みや視覚化を行うツールなど）を使用して BigQuery のデータにアクセス可

Google Cloud SDKをインストールすればコマンドラインが使える
BQは同一リージョンでないとJoinができない、ゾーンはマルチで良い
　BQでは us と eu がマルチリージョン

　　22/4現在のリージョンリスト：asia-east1-2、asia-northeast1-3、asia-south1-2、asia-southeast1-2、australia-southeast1-2、europe-central1-2、europe-north1、europe-west1-6、northamerica-norhteast1-2、southamerica-east1、sourthamerica-west1、us-central1、us-east1-4、us-west1-4

パブリックデータに直でアクセスできる

SELECT * FROM `bigquery-public-data.usa_names.usa_1910_2013`

BigQuery の一般公開データセット | Google Cloud
　→FROM句の書き方：他のプロジェクトを指す名前にハイフンがあるとバッククォートで囲む必要がある

　　`other-prj`.dataset.table　あるいは `other-prj.dataset.table`

■標準SQL
先頭行でレガシーか宣言　#standardSQL あるいは　#legacySQL

バッククォートでエスケープ、プロジェクト区切りも.(ドット)、From句のカンマはCross joinで全組合せかと思われ通常通りjoinやunionを使う事

配列が使える、カラム一つに配列を入れて多元的に扱える

withで一時テーブルを作れる

exceptでカラムを除外、replaceでカラムの置き換え
　select * except(kuso) from a

functionを作って使える標準 SQL ユーザー定義関数 | BigQuery | Google Cloud

分析関数over()とwindowで計算ができる
　rank() over (order by x)は下記moreのRFMに使用している
　ROW_NUMBER() over (order by timestamp) as id,で採番できる

地理関数とかJSON関数とか色々関数もありそう

スクリプトで変数やIfやLoopが使える標準 SQL のスクリプト | BigQuery | Google Cloud
join on a.c=b.cはjoin on using (c)とできる

BigQuery 特集: データ操作（DML） | Google Cloud 公式ブログ
insert into tbl_dest select * from tbl_source　とselect結果を挿入できる

■レガシーSQL（標準SQLを使うのが由）

予約語は角かっこを使ってエスケープ、プロジェクト区切りは:

集計関数で WITHIN キーワードを使用すると、レコード内の繰り返しの値が集計?

FROM句のカンマは標準SQLのCross joinとは異なりUNION ALL 演算子

通常のSQL処理システムとは異なり、BigQueryは繰り返しデータの処理を前提として設計。繰り返しレコードの構造を操作するクエリを記述。その方法の1つが、FLATTEN 演算子?

JOINは、INNER、[FULL|RIGHT|LEFT] OUTER、および CROSS JOIN 演算子をサポート、デフォルトINNER

除外できる　select + from A OMIT RECORD IF COUNT(payload.pages.page_name) <= 80;

TOP を使用するには、SELECT 句に COUNT(*) を含める

分析関数over()とwindowで計算ができる？(標準SQLと同様？)

functionを作って使える(標準SQLと同様？)
JSON等のネストをフラット化

■DDL　データ定義言語ステートメントの使用 | BigQuery | Google Cloud

https://www.isoroot.jp/blog/1651/

auto_incrementもdefaultもprimary keyもindexもshow create tableないのでは？

CREATE TABLE IF NOT EXISTS bangboo_data.x_xxx (

`no` INT64 NOT NULL,

`user_no` INT64 NOT NULL,

`name` STRING,

`date` DATETIME,

)

同じスキーマで作ることもできる

CREATE TABLE ore_ds.test003

LIKE prj.ds.test001

PARTITION BY _PATITIONDATE

■bqコマンドはコンソールで実行できる
ブラウザで該当プロジェクトに入りコンソールボタン、下記ではスキーマをJSONで取得できる

bq show --schema --format=prettyjson myProject:myDataset.tbl001
bq ls -n 3000 dataset_aho (データセット内のリスト3000件、デフォ50件？)

bq cp --force prj:ds.tbl prj:ds.tbl2

上書きコピー（削除しコピー）コンソールだと同名コピーや下記ができない

bq cp ds.tbl1,ds.tbl2 ds.newtbl

2つのテーブルをnewtable にまとめコピー

bq cp -a ds.tbl2 ds.tbl1

tbl2をtbl1に追加コピー --append_table でも同じ

bq load (csvとかgcsのファイルを読み込む）

bq extract (gcsに抽出)

bqコマンドの使い方: UNIX/Linuxの部屋 (q-e-d.net)

■データアップロード時のスキーマ指定
自動検出はFirestore、Datastore、Avro、Parquet、ORCだけ？ほぼ手動のutf-8のcsvかjsonlかを使う形

コンソールで手動スキーマ指定可(jsonスキーマを張付ける)、modeは省略可でデフォはnullable、

JSONスキーマファイルupはaqコマンドのみ可、ローカルからup時のコマンドとスキーマ例↓

bq load --source_format=CSV mydataset.mytable ./myfile.csv ./myschema.json

[

{

"description": "quarter",

"mode": "REQUIRED",

"name": "qtr",

"type": "STRING"

{

"description": "total sales",

"mode": "NULLABLE",

"name": "sales",

"type": "FLOAT"

}

]

なお一旦Google Cloud Storageに放り込んでからやると高速　BigQueryにデータをバッチでインポートする - Qiita

COUNT DISTINCTだが、BigQueryでは概算値が返ってくる??。正確な値が必要な場合は、GROUP EACH BYとCOUNT(*)を組み合わせる

https://www.buildinsider.net/web/bigquery/01

■BQはUTC（Universal Time, Coordinatedの頭文字）

ScheduledQueryを終了日6/9 13:00JSTで即時設定→6/9 01:20UTCで実行された

（終了時間にJST/UTCの考慮が必要か→SQ実行時間設定についてはJSTかUTCに注意するだけ）

実行履歴はUTCのためJSTに読み替える必要がある(UTCはJSTの-9時間)

■BigQuery機能
///クエリ結果を別テーブルに書き込む
その他＞クエリの設定＞クエリ結果の宛先テーブルを設定する
BigQueryではSELECT結果を他テーブルにInsert / テーブル洗い替えなどができる - コード日進月歩 (hateblo.jp)
クエリ結果の書き込み | BigQuery | Google Cloud

///Saved query
プロジェクトに対して保存をして使いまわす等ができる
URLでクエリを共有できる

///Federated Query
スプレッドシートやGCSの外部ソースをBigQueryで

範囲の書き方:シート1!A1:B100

Auto detectにするとHeader skipを1にして1行目をカラム名として使うといい
注意）

　シートで構成を変えると滅茶苦茶になる

　空欄のセルはnullになる

　使う人はBQへもスプレッドシートへも両方権限が必要

///パラメータ(変数)を使う

--parameter=min_count:INT64:250

SELECT word FROM `prj.ds.t` WHERE AND count >= @min_count

パラメータ化されたクエリの実行 | BigQuery | Google Cloud

こういう感じでも使えるのでは

WITH params AS (

SELECT @sheetInput AS p

tmp_pre_processed_src AS (

SELECT * FROM src

)

SELECT * FROM tmp_pre_processed_src

,params

WHERE

tmp_pre_processed_src.a = p

///*を受ける_TABLE_SUFFIXを使う(複数テーブルだとunion allになる)

SELECT year FROM `bigquery-public-data.ds.gsod19*`

WHERE _TABLE_SUFFIX BETWEEN '29' and '35'

ワイルドカードテーブルを使用した複数テーブルに対するクエリ | BigQuery | Google Cloud
　BTWで絞らないと全結合で課金が厳しいかも

　※ワイルドカード注意

　dataset.product_*と書くとdataset.product_20190425だけでなくdataset.product_special_20190425にもヒットしてしまう

betweenは小さいから大きいで、パーティションのないシャーディングテーブル日付きつきテーブルでも行ける（From句のテーブルに動的な名前を使うにはこれか、EXE IMEDIATEくらいか？）
SELECT year FROM `bigquery-public-data.ds.gsod20*`

where _TABLE_FUFFIX between format_date('%y%m%d', date_sub(current_date("Asia/Tokyo"), interval 3 day))
and format_date('%y%m%d', current_date("Asia/Tokyo"))

///時間のパラメータを使う

select * from mytable_{run_time-1h|"%Y%m%d"}

実行時間run_time（UTC）から1時間引いた日→mytable_20180214

クエリのスケジューリング | BigQuery | Google Cloud

///動的にテーブル名を指定してcreate table
パラメータや変数や_TABLE_FUFFIXだけでは難しい。変数はテーブル名とは解釈されない、_table_fuffixはselect分のfrom句に入れwhere句で内容を指定するがcreate分は無理、execute immediateを用いる

DECLARE t STRING;

SET t = (SELECT CONCAT('x_emp_at', FORMAT_DATE("%Y%m%d", DATE_ADD(CURRENT_DATE(), INTERVAL 1 DAY))));

EXECUTE IMMEDIATE format('CREATE OR REPLACE TABLE `%s` AS SELECT * FROM `prj.bangboo_data.x_employee`', t);

ScheduledQueryでは出力テーブルの指定が可能でテーブル指定例：table001_{run_time-1h|"%Y%m%d"}でOK、なおSQL内にはrun_timeが使用できない

//動的にSQLを作成し実行（組織レベルのメタデータを取得

DECLARE all_meta STRING;

SET all meta = (

with projects AS(

SELECT DISTINCT project_id from region-us.INFORMATION_SCHEMA.TABLE_STORAGE_BY_ORGANIZATION

WHERE project_id NOT IN ('対象外プロジェクト)

sql AS(

SELECT

CONCAT('select from`', project_id, "`.`region-us`.INFORMATION_SCHEMA.SCHEMATA_OPTIONS", "\nUNION DISTINCT\n') AS s FROM projects

concat_sql AS(

SELECT REGEXP REPLACE(STRING AGG(s, ''), '(UNIION DISTINCT+)$', '') AS concat_s

FROM sql

)

SELECT SUBSTR(concat_s, 1, LENGTH(concat_s) - 16) AS all_meta

FROM concat_sql

);

--Scheduled query化ならcreate文にする

--EXECUTE IMMEDIATE format('CREATE OR REPLACE TABLE `bq_us_all_dataset` AS %s', all meta);

EXECUTE IMMEDIATE format('%s', all_meta);

///既存のテーブルをコピー(CREATE OR REPLACE TABLEもあり)

CREATE TABLE IF NOT EXISTS bangboo_data.x_employee_copy (

`no` INT64 NOT NULL,

`name` STRING,

) as

select * from `prj.bangboo_data.x_employee`

標準 SQL のクエリ構文 | BigQuery | Google Cloud

データ定義言語ステートメントの使用 | BigQuery | Google Cloud

///timestampとdatetime
datetime型カラムにはCURRENT_DATETIME()、timestamp型カラムにはCURRENT_TIMESTAMP()を使う
　timestampはUTC、datetimeはローカル的で地域指定ができる
　直近3分
　SELECT * FROM `aaa.ds.tbl111`
　WHERE `date` > DATETIME_SUB(CURRENT_DATETIME(), INTERVAL 3 MINUTE)

//stringとdate
func_approved_routine_a('2021-10-31')　引数がstring型
func_approved_routine_a("2021-10-31")　引数がdate型

///日付のキャスト
CAST(date AS STRING)
TIMESTAMP(DATE_SUB(CURRENT_DATE(), INTERVAL 1 month))
BigQueryのStandardSQLで日付（date, datetime, timestamp）を変換する方法 - 寝ても覚めてもこんぴうた (hatenablog.com)
Bigqueryの日時に関係する関数全部試してみた ①Date編 - Qiita

///timeで入っているものを日でサマるSQL

select

count(table_id),

sum(size_bytes),

date(record_time) as record_day

from bq_metadata

where record_time > TIMESTAMP(DATE_SUB(CURRENT_DATE(), INTERVAL 3 month))

group by record_day

order by record_day DESC

///有効期限 table expiration
データセットに対して何日間かにするか設定できる

テーブルに対し特定の日付を設定できる
　何が起こる？＞データセット自体は残るが中のテーブルが無くなる

///パーティション

パーティション分割テーブルの概要 | BigQuery | Google Cloud
BigQueryのStandardSQLで日付（date, datetime, timestamp）を変換する方法 - 寝ても覚めてもこんぴうた (hatenablog.com)

パーティション分割テーブルは2種類：パーティショニングとシャーディング

●シャーディングテーブル
　カラムの増減OK、スキーマとメタデータを持ち権限検証されオーバヘッド有り、ワイルドカード誤操作しやすい→保存向き

●パーティションテーブル
　クエリが早い、カラムの増減に対応できない、上限4000位→利用向き

●シャーディングテーブルにパーティション設定
　各シャーディングtblでパーティションを持たせる、特殊用途で通常どちらかで

TIMESTAMP 列とDATETIME列では、パーティションを時間単位、日単位、月単位、年単位のいずれで

　SQで自動的にtimestampでDAYになる、SQ実行頻度から自動設定される?

ワイルドカード誤操作 *だと_fuyou_20240401等の想定外も含むため_202*にする等の考慮が必要

シャーディングの作り方、yyyymmではダメだった、create文でテーブル名にyyyymmddを付けるあるいはSQのテーブル名に_{run_time-2h["%Y%m%d"}等

シャーディングはテーブルごとに権限を付与が必要で日付別なら実質無理でデータセットで権限管理が必要

クラスタリング　も同時に考慮したい

BigQueryのパーティションとクラスタリングについての解説 - G-gen Tech Blog

BigQuery上のデータマートをクラスタ化したらクエリコストが９割カットできた話 - エムスリーテックブログ (m3tech.blog)

事前にソートし、まとまりを作っておく仕組み。

インデックスのようにカーディナリティが高いカラムを指定してあげると列指向のため全スキャンしなくて良くなる。圧縮率も上がり保存費用も削減できる。

WHERE で指定あるいは GROUP BY される複数列をクラスタ化列として指定するが、指定の順番が重要。

まずパーティションが考慮され、次に最初にクラスタ指定した列で行がソートされ、次にその中で2番めに指定した列でソート、次に3番目...となる

CREATE TABLE ds.tbl_cls (purchase_dt DATE, prod_id STRING, prod_name STRING)

PARTITION BY purchase dt

CLUSTER BY prod_id

１）パーティショニング
BigQueryでパーティション分割テーブルを作成する - goodbyegangsterのブログ (hatenablog.com)　を見よ
パーティショニングは事前に作っておくこと
上限が4000のため最大日単位で11年、時間単位で5か月くらいでpartition_expiration_daysも指定しておく事

CREATE TABLE sample.n225 (

trading_day DATE NOT NULL OPTIONS(description="取引日"),

closing_quotation NUMERIC NOT NULL OPTIONS(description="終値"),

opening_quotation NUMERIC NOT NULL OPTIONS(description="始値"),

high NUMERIC NOT NULL OPTIONS(description="高値"),

low NUMERIC NOT NULL OPTIONS(description="低値")

)

PARTITION BY

DATE_TRUNC(trading_day, MONTH)

OPTIONS (

partition_expiration_days=1825,

require_partition_filter=true,

friendly_name="日経225時系列データ",

description="月別パーティションされた、201901から202107までの日経225時系列データ",

labels=[("environ", "dev")]

)

クエリはpartitioned byのヤツで絞れば良い

select * from aaa_history wehre

#ParticionIDで絞る（つーかpartitioned byのヤツで日付をキャストしてUTCをJST日付に

date(rec_time) = date(datetime_add(datetime "2000-10-10 00:00:00" interval -9 hour))
AND

#実際の時間で絞る、パーティションが日付区切りなので時間検索だけなら全件検索になる

datetime(rec_time) between datetime_add(datetime "2000-10-10 00:00:00" interval -9 hour)
and datetime_add(datetime "2000-10-10 00:59:59" interval -9 hour)

２）シャーディング
シャーディングは_TABLE_SUFFIXを使ったり、テーブル名にハードコーディングする。

日付のキャスト select * from `task_*` where _TABLE_SUFFIX = REPLACE(CAST(date AS STRING), '-', '')

DROP TABLE `task_*`のようにワイルドカードは削除時は使えない
大量削除は下記のようにbq cmdリストを作りBashで。（Terminal貼りつけでも可）
　シャーディングはデータセット別にしてデータセットごと消すようにしたいが
Delete BigQuery tables with wildcard - Stack Overflow

select concat("bq rm --project_id prj -f -t ",table_schema,".",   table_name, ";" )
from INSERT_YOUR_DATASET_NAME.INFORMATION_SCHEMA.TABLES
where table_name like "INSERT_YOUR_TABLE_NAME_%"
order by table_name desc

シャーディングテーブルのビュー化 (Authorized view/routineの設定も必要)

■ その１(_TABLE_SUFFIXカラムが付くが、全期間取得できる)

CREATE OR REPLACE VIEW ds.tablen_snapshot_all AS

SELECT *,

_TABLE_SUFFIX AS table_suffix

FROM gcp-prj-name.ds.tablen_snapshot_**

WHERE_TABLE_SUFFIX BETWEEN '20200101' AND FORMAT_DATE('%Y%m%d',

CURRENT_DATE())

↓下記のように使用する

SELECT FROM `ds.tablen_snapshot_all

WHERE table_suffix BETWEEN '20250530' AND '20250601'

あるいは

SELECT FROM tablen_snapshot_all

WHERE table suffix = '20250601'

■その２ (テーブル関数のため単一日付のみ取得)

CREATE OR REPLACE TABLE FUNCTION ds.fn_tablen_snapshot_by_date(date_str STRING)

SELECT

FROM gcp-prj-name.ds.tablen_snapshot_**

WHERE TABLE_SUFFIX = date_str;

↓下記のように使用する

SELECT FROM `ds.fn_tablen_snapshot_by_date("20250601");

削除されたテーブルは7日以内なら復元することも可能
テーブルの管理 | BigQuery | Google Cloud

BQタイムトラベルで2-7日前のデータを見れる
タイムトラベルを使用した履歴データへのアクセス | BigQuery | Google Cloud

///UNNEST
UNNESTを知らないとBigQueryを使えない？ | 4番は司令塔 (pep4.net)

BigqueryでUNNESTを使いこなせ！クエリ効率１００% | by Eureka Engineering

ARRAY を一組の行にフラット化するには、UNNEST 演算子を使用
SELECT id, title FROM games, UNNEST(titles) AS title

id	titles
1	[skyrim, fortnite]
2	[atvvsmx, mario]

↓フラット化

id	title
1	skyrim
1	fortnite
2	atvvsmx
2	mario

ただしUNNESTで指定したカラムが空の配列やNULLの場合、該当行は無くなってしまうので注意
　id=3 titles=[]やid=4 titles=NULLの時はid=3,4は引っ張れないということ

select * from unnest(['aaa', 'bbb']) as baka -> rowとして2行出る

select ['aaa', 'bbb'] as baka -> 1行目に配列として全て含まれ出る

sql - How to query multiple nested fields in Bigquery? - Stack Overflow
Unnestでもflattenができず空欄ができる場合、結局left join
　空を含むカラムはSelectに残し、repeatedのカラムはleft joinでくっつける
　VariantsをunnestしてるがPricesもrepeatedなのでleft joinのものを出している
　　repeatedもarrayと同じらしいが、、、cross joinやarray_to_stringもやったが駄目だった
　　　なおrepeated以外はunnestが効かない

それでも駄目ならselect句の指定方法やwhere句で絞ると空欄が抜けたよ

select Productid,Variants.SKU,Variants.Size
,Prices.Currency,Prices.Country
from `ga-export-0000.feed.feed_dev`
,UNNEST (Variants) AS Variants
LEFT JOIN UNNEST(Variants.Prices) as Prices

///ARRAY型とSTRUCT型

標準 SQL のデータ型 | BigQuery | Google Cloud

とある古典的SQLおじさんのBigQuery入門：ARRAY型とSTRUCT型 | DevelopersIO (classmethod.jp)
BigQueryのSTRUCT型とうまく付き合う - Qiita

Arrayは上のUnnestを参照。
Structは構造体型。順序付きで親子の構造を持つ。各フィールドはデータ型（必須）とフィールド名（オプション）を持つ。

array型　unnestできる、[]なのでarray_length()で数が取れる

struct型　unnestできる、ネストを含みスキーマでrecord型と表記される、struct型の子へは.ドットで指定す
　stringでJSONはjson_extractを使う
　配列との絡みでjson_query_arrayを使う、2段階くらいは関数で対処できるがそれ以上はwith句がいい
　BigQueryでの複雑なJSON文字列の扱い方と注意点 - Qiita
　JSON functions | BigQuery | Google Cloud

CREATE TABLE IF NOT EXISTS `bangboo-prj.ds.x_list` (

`record_time` TIMESTAMP,

`name` ARRAY

)

INSERT INTO `bangboo-prj.ds.x_list` (`record_time`,`name`) VALUES (CURRENT_TIMESTAMP(),['a','b'])

struct型(record型)は子や孫でヒットすれば親を含めて表示されてしまう

見やすくするため*ではなく、カラムを特定すると空欄が表示されなくなり

親が出なくなり理解しやすくなる（必ずカラム指定したい）

Array=String Repeatedつまりリスト(配列)に値を入れる書式（下記で2つしか入らない）

insert into aaa (aaa) value ("['aaa','bbb']") value has STRING
insert into aaa (aaa) value (`['aaa','bbb']`) Unrecognized name: `['aaa','bbb']`
insert into aaa (aaa) value (['aaa','bbb']) OK
insert into aaa (aaa) value ('["aaa","bbb"]') value has STRING
insert into aaa (aaa) value (`["aaa","bbb"]`) Unecognized name
insert into aaa (aaa) value (["aaa","bbb"]) OK
insert into aaa (aaa) value ([`aaa`,`bbb`]) Unrecognized name
insert into aaa (aaa) value ([aaa,bbb]) Unrecognized name: aaa
insert into aaa (aaa) value ([123,456]) Value has type ARRAY

例）権限が変わっていないかの確認する等

降順で最新の日付のアイテムを見る、そして最終ページの古い日付のアイテムを見る

そしてそれらを比較する

select record_time, name, asset_type, m, b.role

from cai_iam_policy_history

,unnest(iam_policy.bindings) b

,unnest(b.members) m

where record_time between timestamp('2021-05-01') and timestamp('2021-06-30')

and b.role in ("roles/bigquery.dataViewer", "roles/bigquery/jobUser")

and m like '%ketsu@bangboo.com%'

and ancestor_path like '%ketsuproject%'

order by record_time desc

SQL解説）struct型が沢山入っていても全部unnestしfromに入れればいい

　from a, unnest(iam_policy.bindings) b, unnest(b.members) m

unnest(iam_policy)はできないので2階層目から

　　一つ階層上ではunnest時に別名を付けて下の階層はその別名でunnest

struct型の子へは.ドットで指定すればいい、フラットでなくてもbでも取得ができる
↑
通常SQLは「表.カラム」だが「親カラム.子カラム」なので、出元がどこかテーブルを探すかスキーマ内を探すかで迷う

///json_extract, json_extract_scalar
2番目の引数はパス
BigQueryでの複雑なJSON文字列の扱い方と注意点 - Qiita
標準 SQL の JSON 関数 | BigQuery | Google Cloud

with t as (
SELECT unco_data AS col_1 FROM `kuso`
WHERE date = "2021-08-04"
)
SELECT
json_extract(col_1, '$.color') as unco_color,
json_extract(col_1, '$.temperature') as temperature,

json_extract(col_1, '$.fart.times[0].stink') as first_stink,
FROM t

///Pivot
BigQueryでPreviewになったPIVOTとUNPIVOTを試す | DevelopersIO (classmethod.jp)
【SQL】クロス集計を扱う。PIVOT句とUNPIVOT句についてコードを踏まえて解説。 | ポテパンスタイル (potepan.com)
集計をして行を列に変換（生ログをある単位でまとめカラムにする）

--toolのactiveがonなら1、nullなら0でユーザAとBの状況を見る
SELECT * FROM (
SELECT user, tool, active FROM `tools`

)
PIVOT(
MAX( IF (active IS NOT NULL, 1, 0))
FOR user IN ("a", "b")
)
↓
tool　a　b
------------
axe　1　0
sword　0　1

※参考にピボットテーブル

集計して行を列に変換、生ログをある単位でまとめる

　生ログが「日　店　金額」の場合

　↓

　ピボットで「日　金額　（店１　店２　店３）」にする等で、各項目を行と列と値に配置し直す

BigQueryでPreviewになったPIVOTとUNPIVOTを試す | DevelopersIO (classmethod.jp)
PIVOTの中は定数でないとだめだが、
Execute Immediate なら動的にイケる、
がGoogleSheetのConnectedSheetではサポートされておらず無理という罠

///縦持ち横持ち
pivotは集計関数を用いる、単純の入れ替えならSQLならこちら
[SQL]データの縦持ち、横持ちを入れ替える | DevelopersIO (classmethod.jp)

///新旧の差分

比較したいデータの共通してい部分で外部結合をしてnull部分を探す

WITH

old_e AS (

SELECT * FROM status WHERE user IN ('a@old.com')

new_e AS (

SELECT * FROM status WHERE user IN ('a@new.com')

)

SELECT * FROM old_e o

FULL OUTER JOIN new_e n ON o.id = n.id AND o.date = n.date

WHERE o.id is null OR n.id is null

ORDER BY o.id, o.date

unionにexcept distinctをSQLを付けると差分になる

https://qiita.com/tatsuhiko_kawabe/items/2537c562c6d99f83e37b

SELECT * FROM item.item_table

EXCEPT DISTINCT

SELECT * FROM item.item_table WHERE user_id = 'A'

　1つ目の結果から2つ目を引いたものを出す

///REGEXP_REPLACE 正規表現で文字を削除

WITH markdown AS

(SELECT "# Heading" as heading

UNION ALL

SELECT "# Another Heading" as heading)

SELECT

REGEXP_REPLACE(heading, r"^# He", "") AS html

FROM markdown;

標準 SQL の文字列関数 | BigQuery | Google Cloud

///スラッシュで分割するとarrayになるのでオフセットで取得

select SPLIT(path, "/")[OFFSET(3)] from www

スラッシュの最後を取る

ARRAY_REVERSE(SPLIT(aaa, "/"))[SAFE_OFFSET(0)]

引き当てが無い場合はSAFE_OFFSETはNullを返し、OFFSETはエラーを返す

BigQueryの標準SQLでGROUP_CONCATしたいときはSTRING_AGG - GAミント至上主義 (hatenablog.com)
逆にまとめるには

SELECT type, STRING_AGG(DISTINCT name) FROM testData GROUP BY type;

赤身 | ブリ,いわし,アジ,マグロ,カツオ,サバ

白身 | タイ,タラ,フグ,サケ

///Job kill
CALL BQ.JOBS.CANCEL('job_id')
CALL BQ.JOBS.CANCEL('project_id.job_id')

job idでエラー詳細を確認
bq show -j

bq show --project_id bangboo_sandbox --format json -j bqjobidxxxxxxxxxx | jp .

　job idはコンソールのBQのジョブ詳細やスクリプトキックならロギングから見つけてもいい

　クエリならjob/query historyでわかるがbq cmdでもエラーが返る
　　bq query --nouse_legacy_sql 'select ketsu from `prj`.oshi.ri'
　　unrecognized name: 'kusofuke@ketsu.com' at [1:149]

select * from prj.`region-us`.INFORMATION_SCHEMA.JOBS_BY_PROJECT

where job_id ="aaaaa" and creation_time > "2022-01-01"

ジョブIDの取得
SELECT
project_id,
job_id,
user_email,
creation_time,
start_time,
--query,

total_slot_ms
FROM `region-us`.INFORMATION_SCHEMA.JOBS_BY_PROJECT
--`region-us`.INFORMATION_SCHEMA.JOBS_BY_USER
--`region-us`.INFORMATION_SCHEMA.JOBS_BY_FOLDER
--`region-us`.INFORMATION_SCHEMA.JOBS_BY_ORGANIZATION
WHERE state != "DONE"
--state = "RUNNING"
--state = "PENDING"
AND user_email = 'my@email.com'
AND project_id = 'paa'
AND start_time < TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 3 MINUTE)
AND total_slot_ms > (1000 * 30)
AND PARTITIONDATE BETWEEN '2021-01-01' AND '2021-01-02'
--PARTITIONTIME BETWEEN TIMESTAMP('2021-01-01') AND TIMESTAMP('2021-01-02')

///upsert(アップデートか新規インサート

https://swfz.hatenablog.com/entry/2021/02/08/195024

MERGE aaa target USING tmptbl src

ON target.time = src.time

WHEN MATCHED AND src.satus = 'rejected' THEN

DELETE

WHEN MATCHED THEN

UPDATE SET ...

WHEN NOT MATCHED THEN

INSERT ROW

///window関数

集約関数（GROUP BY）だと個別データは出力されず集計データだけでるが

window関数だと集計データが個別データにouter joinされた形で出力される

分析関数のコンセプト | BigQuery | Google Cloud

SELECT

deptname,

id,

salary,

AVG(salary) OVER (PARTITION BY deptname)

FROM emp;

deptname | id | salary | avg_salary

-----------+-------+--------+-------------

dev | 11 | 5200 | 5020

dev | 7 | 4200 | 5020

dev | 9 | 4500 | 5020

dev | 8 | 6000 | 5020

dev | 10 | 5200 | 5020

hr | 5 | 3500 | 3700

hr | 2 | 3900 | 3700

sales | 3 | 4800 | 4866

sales | 1 | 5000 | 4866

sales | 4 | 4800 | 4866

deptnameでグループしそのsalaryの集計のAVGが出ている
下のようにover()が空でも良い、4900は大体

SELECT

deptname,

id,

salary,

AVG(salary) OVER () AS avg

FROM emp;

deptname | id | salary | avg

-----------+-------+--------+-------------

dev | 11 | 5200 | 4900

dev | 7 | 4200 | 4900

dev | 9 | 4500 | 4900

dev | 8 | 6000 | 4900

dev | 10 | 5200 | 4900

hr | 5 | 3500 | 4900

hr | 2 | 3900 | 4900

sales | 3 | 4800 | 4900

sales | 1 | 5000 | 4900

sales | 4 | 4800 | 4900

関数としては集計関数がそのまま使えるようだ

OVERはwindow関数を使う宣言、OVERの後にどのようにwindowを作るのかを定義

PARTITIONでwindowでつまりどの範囲でグループを作るか指定
　AVG(salary) OVER (PARTITION BY deptname, sub_deptname) でサブデプト単位での平均となる

///誰が実行しているかをセッションユーザで出す
標準 SQL のセキュリティ関数 | BigQuery | Google Cloud

SELECT SESSION_USER() as user;

+----------------------+

| user |

+----------------------+

| jdoe@example.com |

+----------------------+

///エラーハンドリング

BQのクエリ内の条件によりerror()でエラーが吐ける

　select error('id is not unique.') from tbl having count(a) > 1
　ERROR関数を使ったBigQueryデータ異常検知例 #BigQuery - Qiita
　SQだとメール送信したり、ロギングやモニタリングでエラー検知できる

///プログラムで使う

https://googleapis.dev/python/bigquery/latest

from google.cloud import bigquery

client = bigquery.Client()

QUERY = ('SELECT name FROM `bigquery-public-data.usa_names.usa_1910_2013`')

query_job = client.query(QUERY)

rows = query_job.result()

for row in rows:

print(row.name)

///Pythonも含めトランザクション

/// BANGBOO BLOG /// - GCP script

■saturationの場合、詰まっている、サチっている
対象にクエリを発行 select 1
同プロジェクトの他のテーブルにクエリを発行 select 1
別プロジェクトから対象にクエリを発行 select 1
reservationsのoverviewを見る
対象のSQLを発行
別のプロジェクトで同SQLを発行
　時間を比べる
Google側の問題と思われるときはGoogleのサポートへGo
Google Could Status Google Cloud Status Dashboard

INFORMATION_SCHEMA < Audit log で調査

メタデータ（データに対するデータ）

　システムメタデータ（作成更新日時、サイズ、誰いつ参照

　ビジネスメタデータ（オーナ、更新頻度、カラムの意味

select * from prj.ds.INFORMATON_SCHEMA.TABLES

select * from prj.ds.INFORMATON_SCHEMA.PARTITIONS

　longterm storageでサイズが100000b以上で、更新日が1か月以上とか出せる

select * from prj.ds.INFORMATON_SCHEMA.COLUMNS where column_name like '%kuso%'

select * from prj.ds.INFORMATON_SCHEMA.VIEWS where view_definition like '%kuso_table%'

　view_definitionはSQL文が入っている

select * from prj.ds.INFORMATON_SCHEMA.JOBS_BY_(USER / PROJECT / ORGANIZATION)

　誰アクセス/誰作った/何Job等も分かる、180日しか出せないが

　roles.bigquery.resourceViewerが必要

　カラム例：user_email、query、referenced_tables

Auditlogは　プロジェクト間で使用されるBQでも情報が取れる

　info_schemaのjobs_byとほぼ同じ内容が取れるがよりリッチ

　　利用ユーザ数、旧データを見ている人、権限変更操作ログ等

///Authrized function
認可済み関数の作成 | BigQuery | Google Cloud

SELECT `b-sandbox`.test_ds.count_row(1);　で実行できる

UDFやテーブル関数のルーティンを承認しておくと誰からでも使える（ビューと違い権限管理できずセキュリティがズブズブになると思われ）

　target_prj.trg_dsに受け入れる関数を共有指定する形

　UDFは戻り値がある、テーブル関数は副問い合わせとして使う形か

///ScheduledQueryの実行者

コンソールの場合：コンソール操作者

Terraformの場合：Terraform実行者

bqコマンドの場合：任意に設定ができる

サービスアカウントをbqコマンドでSQ実行者として登録する場合、通常は問題がないがスプレッドシートを使用するなら@プロジェクト名.iam.gserviceaccount.com等でアクセス権が必要なため、会社のポリシーによってはうまく行かない。batch@unco.comのような共通メールを作成し使用したい。（GWS側でOUを使いTrusted ruleによりSAにGoogleDriveへアクセス許可すると問題回避できるが：OUをつくりそのOU内で専用共有ドライブを作成し設定する）

サービスアカウントにScheduleQueryを実行させる設定に必要な権限

https://cloud.google.com/bigquery/docs/scheduling-queries?hl=ja

設定操作者

　BQ job user（クエリ作成ができない）

　BQ transfers.get/update

　BQ data viewer/editor

　iam ServiceAccountUser(対象SA、PRJレベルでも良いが広くimpersonateできてしまう)
　→対象SAのみならlistも含むがlistが不足しているとされ serviceAccountViewerをPRJレベル付与も必要

　保存先DSへBQ admin等へのsetiam系が2026/3から必要

サービスアカウント

　BQ job user

　BQ data viewer/editor
　※BQ transferは不要だった

Scheduled queryからの保存先
コンソールだと同じプロジェクト内だが、create文を自由記載ならどこでもOK
job userは同じプロジェクトの権限が必要

設定者一覧を出したい場合

bq --format=json --project_id=bangboo-oketsu ls --transfer_config --transfer_location=us | jq.[].name

bq --format=json show --transfer_config project/1111111/locations/us/tranferConfigs/111111 | jq .ownerInfo.email

■SQLはカラム数の増加数で構成考える？
left outer joinはカラム数がカラム数の合計から共通のjoin onのカラム数を引いた数（行数はleftに同じ）
　full outer join はカラム数がカラム数の合計から共通のjoin onのカラム数を引いた数（行数はleftの要素数にrightの要素数を合計したもの）

unionは重複を除外し表を足し合わせるため行数が両表の合計行数（カラム数は合致必要でカラム数は変わらない）

unian allは重複を除外せず表を足し合わせるため行数が両表の合計行数（カラム数は合致必要でカラム数は変わらない）

cross joinはカラム数が両表のカラム数の合計、行数は両表の行数の掛け算

　再帰的にSQL処理はcross joinし条件を付けるか？

　　標準SQLのFrom句のカンマはcross joinとなる
with句は副問い合わせを見やすくしたもの
distinctで(組み合わせで)一意になる行のみにし重複を省く
UNION とUNION ALLの違い - Qiita
CROSS JOIN （クロス結合）を使ってデータを取得する - JOIN （結合）を使いこなそう - SQL Server 入門 (sql55.com)
SQLのDISTINCTとは？（OracleやMySQLで使用する方法） | IT職種コラム (it-kyujin.jp)

デカい表をいくつか持ちJOINすると再帰的にWhere句で条件検索しなくてよい

■課金

クエリ課金：使用しているプロジェクトで課金される、データの置き場所ではない
　定額フラット：$2000/100slot/m(全プロジェクトでスロットを共有)、オンデマンド：$5/T=2Gスキャンで1円位
　　flat rateでもflex slotsとして時間帯によりスロットを増やす等ができる
　　　Editionsに変更になった：組織に5プロジェクト等しかreservationを置けない、その中で限りなく設定ができる

　課金を減らすには：カラムを減らす、パーティショニング
　　プレビューを活用：しかしビューだとプレビュー機能はない。列が501列以上あったら501列以降はプレビュー出ない
データ保管課金：データ量
　$1/50G/m

　active storageからlong term storageへの移行は自動(90日変更がない、50%off)
6,000スロットを使うBigQueryのリソース配分最適化への挑戦 (plaid.co.jp)

■定額制Editions

スキャンサイズが大きくてコンピューティングが少ないならリザベーション (Editions)が向いている、スキャンサイズが小さくてコンピューティングが多いならオンデマンドが向いている

スロット消費量=データ量とコンピューティング

１）データ量: Read量/スキャン量 (スキャン量が多くても単純クエリならスロット消費が少なく単純な比例ではない)

２）コンピューティング負荷: CPU/メモリ消費 (結合/集合/フィルタ/ソート/大量JOIN/複雑なウィンドウ関数等で重いクエリ)

■オンデマンド

必要なクエリ以外は別の定額制のプロジェクトで実行するよう変更

オンデマンドはスキャンしたデータ量で料金が決まる

　実行しているクエリのスキャン量で料金を見積もる

パーティション、クラスタリングでスキャン量を減らす

　BigQueryのパーティションとクラスタリングについての解説 - G-gen Tech Blog

SELECTはNG。必ず必要な列だけを明示する。

スキャン量のモニタリングとアラート設定を実施する。

同じクエリならキャッシュが利くため定額のエディションが有利(24h)

　ソースの更新等でキャッシュが無効になるよ

　BigQueryでクエリのキャッシュを回避する方法 | GLASS BLOG (キャッシュされない条件)

　Bigquery キャッシュについて #GoogleCloud - Qiita (キャッシュ設定/有効無効

　キャッシュに保存されているクエリ結果の使用 | BigQuery | Google Cloud

■権限
事前定義ロールと権限 | BigQuery | Google Cloud
job user：select文クエリ実行だけでもジョブでjob userとdata viewerが要る（data viewerだけでは不足）
　課金プロジェクトでjob userを持ち、参照先プロジェクトでdata viewerを持つという権限構成だから
　例えばjob userがなくdata ownerだけの場合はデータセットやテーブルやビューの削除作成ができるが、データロードやselect文発行はできない
IAMかデータセット/tblに必要な権限を付与する
　data editorでも自分で作成したものは自分がOwnerになり削除や変更権限がある
meta data viewerならDSとテーブル一覧、テーブルのスキーマや容量等の情報が見れデータは見れない
　これを広く付けておくとデータ管理が楽

■サービスアカウントに対するBQ job user

コンソールであれば画面左上の請求先プロジェクトで切り替えができるが

スクリプトであればgcloud auth login時に切り替える

gceならインスタンスにSA設定するが

　請求先プロジェクトのデフォルトはインスタンスの置いている/SAが作成されたPrj
　　※同プロジェクトからしか選択ができない

　コード上で切り替えができる

　　bq --project_id=xxx query 'select count(*) from ds.tbl'

/// BANGBOO BLOG /// - BigQuery part2

Posted by funa : 01:00 AM | Web | Comment (0) | Trackback (0)

February 11, 2021

Python Python

■importとfrom
Pythonのモジュールとimportとfrom入門 - Qiita

Python, importの使い方（from, as, PEP8の推奨スタイル, 注意点など） | note.nkmk.me
Pythonインポート周り徹底理解への道 - Qiita
Pythonの相対インポートで上位ディレクトリ・サブディレクトリを指定 | note.nkmk.me

標準ライブラリならimport文を本体に書いていれば良い
　標準ライブラリ以外はPyPI（Python Package Index）と呼ばれる3rdパーティライブラリから
　pip（The Python Package Installer）インスコ

import文を使って下記の3つなどをインポートし使う
　標準ライブラリ
　pipでインスコしたパッケージ
　自作のパッケージ
自作は大体わかるがそれ以外はどこにあるのか？

　$ python

　>>> import sys
　>>> sys.path
　でパス一覧が出るので探すと分かる　>>> exit()でpythonコマンド終了
例えば Cloud functionsなら requrements.txtに google-api-python-client==3.3.2と記載し
　PyPI · The Python Package Index　でバージョンを探す
コードに from google.cloud import bigqueryと宣言する
　requirementがpipインスコ

import フォルダ.ファイル名

from フォルダ.ファイル名 import *

　上下同じだが、fromは一部を指定し直接使うという意、*は非推奨

　つまり

import hello なら下記とする必要があるが

print(hello.hello)

from hello import hello なら省略ができ下記で良い

print(hello)

from フォルダ名　の場合

　そのフォルダ名の中に __init__.pyがあれば其れ

from .xxx import aaa の.の意味は？
　mainに対するモジュールから見て相対で隣

モジュール検索パスを出す

from pprint import pprint

import sys

pprint(sys.path)

■pipインスコ

pipの使い方 (2014/1バージョン) — そこはかとなく書くよん。ドキュメント (tdoc.info)

Python：pip における管理者権限と user install - pyてよn日記 (hatenablog.com)

Python でパッケージを開発して配布する標準的な方法 - Qiita

pythonのsetup.pyについてまとめる - Qiita

PyPIでサードパーティライブラリを管理していてインスコ可

setup.pyが含まれたローカルディレクトリも指定しインスコ可

eオプションで編集可能な状態でインスコ

--userで~/.local下の管理権限不要なユーザディレクトリ以下でシステムが汚れない

--userなしで/usr下にインスコ

pip install --user -e unko

pip3 install pipenv

pip list　インスコ済みのものを確認

pip install -r requirements.txt　reqirements.txtで一括インスコ
pip freeze > r.txt　pip listをファイルに書き出す
pip uninstall -y -r r.txt　-yで確認なしで一括アンインストール
Python, pipでrequirements.txtを使ってパッケージ一括インストール | note.nkmk.me

パッケージとバージョンを指定してアップデート

pip install -U google-cloud-bigquery==3.4.0

下記にもろもろ
pipでパッケージをupdate｜pip自体のアップデートについても解説 (itc.tokyo)

■envツール

pyenv　パイソンバージョン管理としてインスコ
ubuntu 20.04 / 18.04 に pyenv をインストールする話 #Python - Qiita
pyenvのインストール、使い方、pythonのバージョン切り替えできない時の対処法 #Python - Qiita

　pyenv install --list　インストールできるもの

　pyenv install 3.8.8　指定verをインスコ

　pyenv global 3.8.8　デフォルトに指定

　.python-versionファイルをGITに載せ管理したい？

pipenv　PIP管理としてインスコ
Pipenvでの基本的な環境構築 - Pirika Developers Blog

　pipenvはPipfileとPipfile.lockを利用しpipでrequrements.txtを用いるよりも強力

　　PipfileとPipfile.lockとrequirementsをGITに載せ管理したい？

　pipenv --python 3.8.8　など最初にpyバージョンをpipfileに記載

　pipenv install "google-cloud-tasks==1.5.0"　バージョン無しでも有りでも入れられる
　Pipfileを書き換える方法

　　[packages]

　　google-cloud-tasks = "==1.5.0"

　　protobuf = "*"

　　そして下記cmdでインスコ

　　pipenv install　PipefileからインストールしPipefile.lockを更新

　pipenv sync　Pipfile.lockの最新を取得し環境更新(Pipefileは使わない）

　pipenv shell　仮想環境を起動
　pipenv run python main.py

　他に
　pipenv uninstall google-cloud-tasks　アンインスコ

　Pipfile, Pipfile.lockがあれば pip syncでOKだがrequirements.txtも使える

　pipenv lock -r > requirements.txt　生成

　pipenv install -r requirements.txt

pipenvのバージョンが古いと依存関係、Ver整合性で問題が起きやすい

　pipenv --version

　pip install pipenv

　pipenv update

　pipenv upgrade <パケ>でやり直す

■assertでテスト

[Python] assert文で超お手軽テスト #Python - Qiita

assert文は組み込み定数__debug__がTrueの時のみ実行されます

実行コマンドにオプションに-Oをつけると__debug__がFalseになりassert文が無効に

def func_so(a, b):

c = a * b

return

def test():

assert(func_so(1,2) == 2)

if __name__ == "__main__":

test()

main()

■テスト駆動

PyTest を LLMに書いてもらいたい。下記のようなプロンプトで準備できるのでは?

https://aaaa にアクセスし名前欄にaaaと入力すると名前欄に英数が入っていますとエラーが出る

■PyTest

assert

成立すべき式(Trueになるべき式) をassert文で記述

テストの準備と後処理

@pytest.fixtureデコレータをつける

実行(ディレクトリのtest、testファイル、test 関数が対象)

pytest

テストカバレッジを確認：tests/ディレクトリ内の全テストを実行し現在のディレクトリ内のコードについてどれだけテストでカバーされているかを測定

pytest -covs=. tests/

■test app.pyでエラー表示を拾ってテスト

import pytest

from app import app

@pytest.fixture

def client():

app.config['TESTING'] = True

with app.test_client() as client:

yield client

def test_valid_input(client):

response = client.post(

'/',

data={'name': 'TestUser', 'email': 'Test@example.com'},

follow_redirects=True

)

assert b'OKでっせ' in response.data

def test_invalid_name(client):

response = client.post(

'/',

data={'name': 'ThisNameIsTooLong', 'email': 'test@example.com'},

follow_redirects=True

)

assert b'name At most 10 characters long' in response.data

def test_invalid_email(client):

response = client.post(

'/',

data={'name': 'ValidName', 'email': 'Invalid email'},

follow_redirects=True

)

assert b'emailがinvalid email addressなんだけど' in response.data

■パラメータを複数種類

import pytest

@pytest.mark.parametrize(

"x, y", [

("aaa", "bbb"),

("aaa", "aaa"),

("bbb", "bbb")

]

)

def test_1(x, y):

assert x == y

■fixture: fixture@yieldまでの処理> テスト本体> fixtureのyield後からreturnまでの処理

import pytest

from pathlib import Path

import shutil

def create_file(path):

# 指定されたパスにファイルを作成する関数

path.touch()

# 一時ディレクトリを作成するフィクスチャ

@pytest.fixture()

def create_tmp_dir():

# 一時ディレクトリを作成

tmp_dir = Path("/tmp/test")

if not tmp_dir.exists():

tmp_dir.mkdir()

yield tmp_dir

# 一時ディレクトリを削除

shutil.rmtree(tmp_dir)

def test_create_file(create_tmp_dir):

target_file = create_tmp_dir / "test.txt"

create_file(target_file)

assert target_file.exists()

■個別

import dataclasses

[詳解] Pythonのdataclasses (zenn.dev)
　データ格納するオブジェクトを作れば使い回しが楽

import datetime

Pythonのdatetimeで日付や時間と文字列を変換（strftime, strptime） | note.nkmk.me

pip install pyyaml > import yaml

Python で YAML ファイルを扱う - まくまくPythonノート (maku77.github.io)

pip install requests > import requests

Requests の使い方 (Python Library) - Qiita

　SlackのwebhookにPostするとか

tenacityでリトライ処理
[Python] tenacity ライブラリを利用してリトライ処理を簡単に実装する (zenn.dev)

boto3で並列処理

Python 3.12で増えた並列処理と、これまでの並列処理の挙動を比べてみる #Python - Qiita

Python + VSCode の環境構築 20240604 (zenn.dev)

↓本家
/// BANGBOO BLOG /// - Python

Posted by funa : 12:00 AM | Web | Comment (0) | Trackback (0)

February 10, 2021

Python

おッPythonやるのか？

ファイル拡張子oppython.py デフォUTF-8、全部オブジェクト(list,dict,set等のミュータブルなら参照になる点に注意、必要ならcopy())

#コメント、ドキュメントストリング(三連引用符)："""そのまま表示"""　print mymod.__doc__で見れる

変数型不要：p = 500 * num、でもキャストは必要、定数はない

文字繰り返し、キャスト："文字列" * 4 + str(p) + "Hi\nお元気ですか？\nSee u"

raw文字列でescしない：print(r"インストール先は c:\\code\python\bin です")
　正規表現のrも同意　re_result = re.match('hel', r'hellow python, 123, end.' )
　　if re_result: #None以外という意味で、Noneはいわゆるnull、Pythonにnullはない

文字数：len("東京都")→3

文字列[開始:終了]→→ str = "Flower" print(str[1:4]) → low

文字列 % (値1, 値2, ...)→→ num= "10進数では %d 、16進数では %x " % (num, num)
"xxxx{index:書式指定子}xxxx".format(値)→→ "名は{:<8s}で年は{:>3d}で".format(name, age)

f"xxxx{値:書式指定子}xxxx"→→ f"名は{name:<8s}で年は{age:>3d}で"

0／空の文字列''／値なしはfalse、Noneは？ x = None x is None→→true？

//→除算切り捨てし整数、**→べき乗
関数宣言はdef kansu(): で中で宣言する変数はローカル変数
　関数外で宣言された変数はグローバル変数でどの関数の中でも扱えるようになる
　なお関数内でもglobal henでグローバル変数を宣言できる　Pythonでのグローバル（global）変数の宣言方法 | UX MILK
返り値複数はcsvでタプルになる、リストが楽か？ return a,b → (a, b)　あるいは return [a, b] → [a, b]

def func(a, b):

return a, b

result = func()

result[0]がa、result[1]がb

try／exceptを関数内で設定することも、逆に関数呼び出し時にも使用ができる、else, finally, raiseも使う、エラーが出ても止めたくない場合は try-except Exceptions as e、逆にexceptを入れなければ止まるので安全

try:

get_all_transfer(project_id)

excerpt Exception as e:

print(e)

置換は左辺が要る？要る a = a.replace('x','')
とほほのPython入門 - リスト・タプル・辞書 - とほほのWWW入門 (tohoho-web.com)
Pythonの辞書とリストとクラス　複数情報の受け渡し｜みはみ｜note
リストa=[1,2,3]はmap(), filter(), reduce()等が使える
　a=a.append()とかa=a.extend()は値がないんで駄目、単純にappend(b)やextend(b)で左辺不要
　取得：a[0]、for v in a:
　リストの合体：list_a += list_b
セット型set={1,2,3}は重複や順序や添字の無いリスト、set(list)でキャストし重複を無くせる、ミュータブルは格納できない
　取得 for v in a:
tuple→タプルは定数リスト、更新無しならリストより速い　a = 1,2,3　a = (1, 2, 3)
　取得：a[0]、for num in a:

dict→辞書は連想配列みたいな{a:1,b:2}はitems(), keys(), valus(), iteritems(), get()を使える
　Python | 辞書に含まれるすべてのキーと値を取得する (javadrive.jp)
　取得：dict_a['key1']、for k in dict_a.keys(): for v in dict_a.values(): for k, v in dict_a.items():
　dictの合体：dict_a.update(dict_b)
クラス→例えば●●クラスを宣言しsampleインスタンスを生成し、getter/setterで変数に入れて置く
　取得：sample.key
BigQuery→別名を付ければ名前で取得できるが、インデックスでも取得できる（これ何？）
　取得：for row in query_job:　→row[0], row["t"]

lambdaは無名関数？
str_w = input('何か入力してください-->')　#入力させた値を取れるが数字もstr

__iter__()はnext()を持つオブジェクトを返し、next()は次の要素を返し、最後に達するとStopIteration例外を返す？

yield はイテレータを返すジェネレータを定義？

@デコレータは関数を実行する前後に特殊な処理を実行したい場合？

withで終了処理を指定できる、ファイル読込とその後の処理とか
assertや__debug__はテストで機体通りかを確認する？
passは中身の無い関数やクラスを作成しkara.p=1で粋なり属性追加等ができる
execは引数の文字列をPythonとして実行　exec "print 'Hello'"
delはオブジェクトを削除　del x, y, z

継承やオーバーライド　class MyClass2(MyClass):
多重継承class MyClassC(MyClassA, MyClassB):　で纏めて使えるようになる
class MyClass:

"""A simple example class"""　　# 三重クォートによるコメント

def __init__(self):　　# コンストラクタ

self.name = ""

def __del__(self):　#インスタンスが消滅する際に呼出でコンストラクタ

print "DEL!"

def __str__(self):　#文字列化

return "My name is " + self.name

def getName(self):　　# getName()メソッド

return self.name

def setName(self, name):　　# setName()メソッド

self.name = name

class MyClass2(MyClass):

def world(self):

print "World"

class MyClass3(MyClass):

def hello(self):　　# 親クラスのhello()メソッドをオーバーライド

print "HELLO"

a = MyClass()　　# クラスのインスタンスを生成

a.setName("Tanaka")　　# setName()メソッドをコール

print a.getName() 　　# getName()メソッドをコール

print a　　#=> My name is Tanaka　文字列化

b = MyClass2()　　#継承

b.hello() 　　#=> Hello

b.world() 　　#=> World

c = MyClass3()　　#オーバーライド

c.hello() 　　#=> HELLO

super()を使ってオーバーライドする

　super()は基底クラスのメソッドを継承した上で処理を拡張

　super().__init__(x、y)が使える

if __name__ == "__main__":

　モジュール時の勝手実行を抑える

　　import helloの時hello.py 内部での __name__ は "hello"

　　python hello.pyのような実行時hello.py の内部の __name__ は "__main__"
from math import pi, radians→mathモジュールから特定のオブジェクト(関数/変数/クラス)をimpo(math.piみたいに書かず省略できる)

import urllib.error→urllibパッケージからerrorモジュールをimpo、パッケージはフォルダ

import numpy as np→別名でしか使えなくなるnp.array()とかで

　モジュール=ファイル名.pyでファイルをimpoしている

from {another_file} import {ClassName}

　another_file.pyがファイル名

　class ClassNameがクラス名
from {パッケージ：ディレクトリ} import {モジュール：ファイル}
　ちゅー書き方もできるらしいが、どっち？

impo順：標準ライブラリ＞サードパーティライブラリ＞ローカルライブラリ(自作のライブラリ)

関数や変数：小文字スネークケース（sample_func）

クラス名、例外、型変数：キャピタルパスカルケース（SampleClass）

定数名：大文字アンダースコア区切り（SAMPLE_CONST）

モジュール名：小文字（samplemodule, sample_module）

パッケージ（フォルダ）名：小文字。アンダースコア非推奨（samplepackage）

インデントは半角スペース4つ

1行半角で79文字以内

トップレベルの関数やクラスは2行開ける

クラス内部では１行ずつ開けてメソッド定義
ドックストリングでクラスや関数についてコメントする(慣習的にダブルクォート)
　コード中は処理についてのコメントをなくし関数化とdocstringで参照するように
　「コメント(#)とdocstring(""")の違いは？」コメントとdocstringについて
　[Python]可読性を上げるための、docstringの書き方を学ぶ（NumPyスタイル） - Qiita

デバッグの方法案
print(type(v))　でどんなメソッドを持っているか等を探る
print(v)　をコマンド前後や流れで沢山仕込みでどこでエラーが出ているか探す

print("creds:")

print(creds)

print("type(creds:")

print(type(creds))

print("vars(creds:")

print(vars(creds))

print("creds.keys():")

print(creds.keys())

print("dir(creds):")

print(dir(creds))

print("creds._dict_:")

print(creds.__dict__)

is not subscriptableのエラー　添字不可エラーでリストでないのにリストとして入れようとしている

※参照になりコピーされない、必要ならコピー(値を入れた時点で参照が外れるので実際問題少ない？)

a = []

b = a

b.append(1)

print(a) #[1]

https://qiita.com/ponnhide/items/cda0f3f7ac88262eb31e

https://nishiohirokazu.hatenadiary.org/entry/20120125/1327461670

環境変数を扱う

　import os

　print(os.environ["HOME"])　ホームディレクトリ、LANGでja_JP.UTF-8とか

　os.environ["PHASE"] = "staging"　環境変数に代入できるのは文字列だけ

　del os.environ["PHASE"]　削除

コマンドラインの引数を扱う

　python3 sys_arg_test.py a 100
　　dst_prj = sys.argv[1]　（aが入っている）

　　sys.argv　（['sys_arg_test.py','a','100']

Pythonのリストと文字列を相互に変換する方法まとめ | HEADBOOST
→リストをStrに変換してSQLにする場合For文が良い（Pythonの書式とSQL書式のコンビなので丁寧に対処するため）

i = 0
v = "["
for s in list_v:

i += 1

if i > 1:

v += ","
v += "'" + s + "'"
v += "]"

SQL = "insert into aaa (aaa) value ({v})"

※テキスト選択

　Shift↑or↓　で行全体

　home(+fn)で行頭、end(+fn)で行末移動

【基礎一覧】Pythonの基本文法を全て解説してみた！【初心者】 (suwaru.tokyo)
Python基本文法まとめ - Qiita
とほほのPython入門 - とほほのWWW入門 (tohoho-web.com)

Python入門～Pythonのインストール方法やPythonを使ったプログラミングの方法について解説します～ | Let'sプログラミング (javadrive.jp)
Welcome to Python.org

HTMLの中に少し埋め込めず、基本的にプログラムの中にHTMLを埋め込む：CGI(Perl然)
　さくらインターネットでPython CGI (mwsoft.jp)
WSGI　Python で WSGI (Web Server Gateway Interface) に従ったシンプルな Web サーバで Hello World - Qiita
Python用Webサイト用途フレームワーク：Flask(軽量)、Django
　WSGI について — Webアプリケーションフレームワークの作り方 in Python (c-bata.link)
　GCPでどう使うかは不明だがホスティングは↓
　ウェブホスティング | Google Cloud　静的ウェブサイトのホスティング | Cloud Storage | Google Cloud

str.split() 区切り文字で分割しリスト等に入れる　Pythonで文字列を分割（区切り文字、改行、正規表現、文字数） | note.nkmk.me
print('Sam' in 'I am Sam') # True　任意の文字列を含むか判定: in演算子　Pythonで文字列を検索（〜を含むか判定、位置取得、カウント） | note.nkmk.me
＝＝＝＝＝＝＝＝＝＝＝＝＝＝
ここで動かせるgoogle colaboratory→　Colaboratory へようこそ - Colaboratory (google.com)

コラボラトリはマークダウン　Qiita マークダウン記法一覧表・チートシート - Qiita

半角スペース２個で改行

#の数で見出し

*で箇条書き

数字と.で番号を振る、- でリスト

* or - or _ を３つ以上で水平線

[ ]でチェックボックス、[x]でチェック

| td | td | td |でテーブル

**aaa**で太字、*aaa*で斜体

~~aaa~~で打消し線

[タイトル](URL)でリンク

```でコードの挿入、`でインライン挿入

> or >> で引用
[^1]で注釈

\バックスラッシュでマークダウンのエスケープ

＝＝＝＝＝＝＝＝＝＝＝＝＝＝
宗教論争（事実は同じでも他人の認知は違うので意味なし
if self.flag_ok == 1 and self.mode == '1'
↓一見で分からんなら変数名を工夫してこうやんな
if self.file_verify_completed and self.mode == GRANT_PERMISSION:

マジックナンバーを使わない(数字の方が曖昧性が無い場合も)

STATUS_ERROR = -1

STATUS_SUCCESS = 0

self.status_error = STATUS_SUCCESS

with構文で処理の前後でコンテキストマネジャ__enter__、__exit__が使われる

　__enter__メソッドで事前処理

　__exit__メソッドで事後処理

with ファイル操作や通信などの開始時の前処理と終了時の後処理など必須となる処理を自動で実行

try/finallyみたいなもの、最初と最後に何かしてくれる

class a(object):

def_enter_(self):

print 'sss'

return 'sss111'

def_exit__(self, type, value, traceback):

print 'ok'

return False

with a() as s:

print s

sss

sss111

Pythonのwith文の正体 (zenn.dev)

初期値をエラー値にし、業務判定エラーでステータスを設定したらreturnで抜ける

def exFunction(self):

self.status_error = STATUS_ERROR

try:

if XX = AAA:

self.status_error = STATUS_XX_ERROR

retrun

self.status_error = STATUS_SUCCESS

retrun

except:

～エラー処理、ステータスは変更しない

エラーメッセのハードコーディングを避ける方法(ハードが場所と内容が分かり易いかも)

MSG_ERROR_OLD_EMAIL = "Error: 旧メール%sです\n"

e_message_list.append(MSG_ERROR_OLD_EMAIL % (old_email))

self.error_message = '\n'.join(e_message_list)

ケチって分厚い本1冊にしたが全然進まぬ、薄い奴星e、？チッPython、誰がJSONじゃ～い、チェーンソー魔わすっぞ

続編、、モジュールとかmportとか、
/// BANGBOO BLOG /// - Python Python

Posted by funa : 07:30 PM | Web | Comment (0) | Trackback (0)

For mobile click here
For smart phone click here

#1	Web
#2	Hiace 200
#3	Gadget
#4	The beginning of CSSレイアウト
#5	Column
#6	Web font test
#7	Ora Ora Ora Ora Ora
#8	Wifi cam
#9	みたらし団子
#10	Arcade Controller
#11	G Suite
#12	PC SPEC 2012.8
#13	Javascript
#14	REMIX DTM DAW - Acid
#15	RSS Radio
#16	Optimost
#17	通話SIM
#18	Attachment
#19	Summer time blues
#20	Enigma
#21	Git
#22	Warning!! Page Expired.
#23	Speaker
#24	Darwinian Theory Of Evolution
#25	AV首相
#26	htaccess mod_rewite
#27	/// BANGBOO BLOG /// From 2016-01-01 To 2016-01-31
#28	竹書房
#29	F☆ck CSS
#30	Automobile Inspection
#31	No ID
#32	Win7 / Win10 Insco
#33	Speaker
#34	Arcade Controller
#35	Agile
#36	G Suite
#37	Personal Information Privacy Act
#38	Europe
#39	Warning!! Page Expired.
#40	GoogleMap Moblile
#41	CSS Selectors
#42	MySQL　DB　Database
#43	Ant
#44	☆od damnit
#45	Teeth Teeth
#46	Itinerary with a eurail pass
#47	PHP Developer
#48	Affiliate
#49	/// BANGBOO BLOG /// From 2019-01-01 To 2019-01-31
#50	/// BANGBOO BLOG /// From 2019-09-01 To 2019-09-30
#51	/// BANGBOO BLOG /// On 2020-03-01
#52	/// BANGBOO BLOG /// On 2020-04-01
#53	Windows env tips
#54	恐慌からの脱出方法
#55	MARUTAI
#56	A Rainbow Between Clouds‏
#57	ER
#58	PDF in cellphone with microSD
#59	DJ
#60	ICOCA
#61	Departures
#62	Update your home page
#63	CSS Grid
#64	恐慌からの脱出方法
#65	ハチロクカフェ
#66	/// BANGBOO BLOG /// On 2016-03-31
#67	/// BANGBOO BLOG /// From 2017-02-01 To 2017-02-28
#68	/// BANGBOO BLOG /// From 2019-07-01 To 2019-07-31
#69	/// BANGBOO BLOG /// From 2019-10-01 To 2019-10-31
#70	/// BANGBOO BLOG /// On 2020-01-21
#71	Bike
#72	Where Hiphop lives!!
#73	The team that always wins
#74	Tora Tora Tora
#75	Blog Ping
#76	無料ストレージ
#77	jQuery - write less, do more.
#78	Adobe Premire6.0 (Guru R.I.P.)
#79	PC SPEC 2007.7
#80	Google Sitemap
#81	Information privacy & antispam law
#82	Wifi security camera with solar panel & small battery
#83	Hope get back to normal
#84	Vice versa
#85	ハイエースのメンテ
#86	Camoufla
#87	α7Ⅱ
#88	Jack up Hiace
#89	Fucking tire
#90	Big D
#91	4 Pole Plug
#92	5-year-old shit
#93	Emancipation Proclamation
#94	Windows env tips
#95	Meritocracy
#96	Focus zone
#97	Raspberry Pi
#98	Mind Control
#99	Interview
#100	Branding Excellent

Column [136]
Europe [9]
Gadget [79]
Web [137]
Bike [4]

竹書房 Timeless on Jan 01
Ting on Nov 09
空（出た～） on Oct 21
バカ on Aug 10
え、待って on May 06

< February 2021 >
Sun	Mon	Tue	Wed	Thi	Fri	Sat
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28