/// BANGBOO BLOG ///

Web List

GitHub Actions on Dec 27, 2024 9:25 PM
Flask on Sep 05, 2024 11:34 PM
BT on Jun 21, 2024 11:00 PM
Cloud SQL on Jun 02, 2024 1:06 PM
GCP hands-off 3 on Jun 01, 2024 3:24 PM
Pubsub on May 09, 2024 12:00 AM
HELM on Apr 27, 2024 11:27 PM
GKE on Jan 14, 2024 9:59 PM
GCP Network Connectivity on Oct 31, 2023 10:57 PM
Machine learning(Bigquery ML) on Jun 21, 2023 8:00 PM
GCP Python Google doc編集 on Jun 01, 2023 12:00 AM
GCP hands-off 2 on May 29, 2023 7:30 PM
HSTS/CORS/CSPOAuth/OpenID/SAML/XSS/CSRF/JSOP/SSO/SSL/SVG/JWT/WebAssembly on Feb 11, 2023 1:46 AM
Docker on Jul 24, 2022 3:46 AM
LPIC on May 18, 2022 3:20 AM
Goo ana 4 on Apr 23, 2022 11:00 AM
I drive or test driven on Apr 17, 2022 9:54 AM
GCP Python script on Apr 01, 2022 12:00 AM
GCP runs off functions pubsub on scheduler on Mar 30, 2022 7:59 PM
GCP script on Feb 26, 2022 2:52 AM
リンク踏合組合 on Dec 25, 2021 5:46 PM
k8s on Jun 09, 2021 12:01 AM
GCP Hands Off on May 22, 2021 12:00 AM
GCP ログ・アセット調査 Logging/Bigquery information schema/Asset inventory on May 22, 2021 12:00 AM
GCP part2 on May 21, 2021 12:00 AM
GCP on May 20, 2021 9:00 PM
Terrafirma on May 02, 2021 10:14 PM
Linux cmd2 on Apr 02, 2021 1:00 AM
Linux cmd on Apr 02, 2021 12:00 AM
BigQuery part2 on Feb 22, 2021 12:00 AM

December 27, 2024

GitHub Actions

ChatGPTかGeminiかに聞けば良さそう

■GitHub Actionsの動作内容はリポジトリ内に設定されている.github/workflows内のYMLにある

steps:

- name: Checkout

uses: actions/checkout@v4

@以下はバージョン、特定のコミットSHAにもできる @3df4ab11eba7bda6032a0b82a6bb43b11571feac #v4

Commits · actions/checkout · GitHub

onセクションにPushやPR作成やスケジュール実行等のトリガーや対象ブランチやパス等も書かれている

Secretsや環境変数は、Terraformでクラウドプロバイダーにアクセスする場合等で、GitHub Actionsのsecrets で認証情報が設定されていることが多い。これらはリポジトリのSettings > Secrets and variables > Actions で確認可能。

GitHub Actions でのシークレットの使用 - GitHub Docs

on:

push:

branches:

- main #この場合、mainブランチへのpushでトリガーされる

jobs:

terraform:

runs-on: ubuntu-latest

steps:

- name: Checkout code

uses: actions/checkout@v3

- name: Setup Terraform

uses: hashicorp/setup-terraform@v2

with:

terraform_version: 1.4.0

- name: Initialize Terraform

run: terraform init

- name: Apply Terraform

run: terraform apply-auto-approve #terraform planなしじゃ

Posted by funa : 09:25 PM | Web | Comment (0) | Trackback (0)

September 5, 2024

Flask

■formaction (hidden以外でのSubmit先変更方法)

buttonや inputのtype=submit/image に付与できる

ベースとなるのはformのidのformタグ<input... form="formのid">

下記のような属性がある

　formaction

　formenctype

　formmethod

　formnovalidate

　formtarget

■jinja2

【Flask】Jinja2のテンプレート継承でHTMLファイルを役割ごとに分割する | たぬハック (tanuhack.com)

[Flask/Jinja2]extendsやincludeを使い、メンテしやすいテンプレート構築を目指す | pixelbeat sandbox

Jinjaテンプレートの書き方をがっつり調べてまとめてみた。 #Python - Qiita

///dict

my_dic['name'] = 1

return render_template('index.html', message=my_dic)

テンプレ側

///リスト

num_list = np.arange(10)

return render_template('index.html', message=num_list)

テンプレ側

{% for num in num_list %}

{% endfor %}

///改行

{%- xxx -%} jinjaタグの前後マイナスで改行空白を除外する
+はtrim_blocks(改行詰め)、Istrip_blocks(空白詰め)を無効化する設定で俺は使わない

from jinja2 import Environment

jinja_env = Environment()

jinja_env.trim_blocks = True

jinja_env.Istrip_blocks = True

///置換
{{ "aaagh" | replace("a","oh,","2") }}
-> oh,oh,agh
{{ input['txtarea'] | replace("\n","<br />") }}

///エスケープ
safeフィルタがなければhtmlエスケープがかかる

{{ output | safe }}
あるいは
{{% autoescape False %}}{{ output }}{{% endautoescape %}}

///コメント(複数行ok)

{# note: commented-out we no longer use this

　{% for user in users %}

　…

///生

{% raw %}

<ul>

{% for item in seq %}

{% endfor %}

</ul>

{% endraw %}

///extend と block と include

●flask

page=page_a.model(user)

return render_template("layout.html",title=title,page=page)

●layout.html (テンプレ切替と共通ブロック、共通ブロックはテンプレに書いた方分かり易い?)

{% if page['destination']== 'confirm' %}

{% extends "template_confirm.html" %}

{% elif page['destination']== 'complete' %}

{% extends "template_complete.html" %}

{% else %}

{% extends "template_html" %}

{% endif %}

{% block body %}

{% include "header.html" %}

<p>content here.</p>

{% endblock %}

●template.html

<html>

<body>

<h1>{{ title }}</h1>

{% block body %}

{% endblock %}

#0以上の入力データの確認 (空の確認やintへのキャスト)

#{% if 'inquiry_id' in page['input'] and page['input']['inquiry_id'] is not none and page['input']['inquiry_id'][int > 0 %}

{% if page[input']['inquiry_subject'] %}

{% else %)}

{% endif %}

{% include "footer.html" %}

</body>

</html>

●header.html

●footer.html

<p>author.p</p>

●page_a.py

def model(user):

value_return = ""

input = {}

error = {}

value_return <br>under constructions taken place by user '<br>'

#入力があった、

if request.method == "POST":

transition = request form.get("transition")

#get, post, 取得するもので書き方が違う

#request.args.get("inquiry_id")

#request.form.get("inquiry_id"

#request.json.get("inquiry_id")

logging warming('#####' + user + 'transition: ' + str(transition)+'#####')

if transition == "new" or transition == "error" or transition == "confirm back":

flag_ng=0

#入力値の判定

error_txt_inquiry_subject = []

inquiry_subject = request.form.get("inquiry_subject")

ff not checkRequire(inquiry_subject):

error_txt_inquiry_subject.append("件名が空欄です”)

flag_ng=1

input[inquiry_subject] = inquiry_subject

if flag_ng == 1:

error['error_txt_inquiry_subject] = error_txt_inquiry_subject

#エラー画面を出す

destination = "error"

else:

#確認画面を出す

destination = "confirm"

#End of transition == "new" or transition == "error" or transition == "confirm back":

else:

#transition == "confirm_proceed"

#登録処理し完了画面を出す

destination = "complete"

else:

#初期画面を出す

destination = "new"

return ("value":value_return, "destination":destination, "input":input, "error":error)

■改行
プレースホルダー内での改行は&#13:に置き換える

JINJA2のフォーム入力後の確認HTMLの改行は?

置換ではhtmlエスケープが掛かり<br>がそのまま表示されてしまいダメ

htmlエスケープ（HTMLエスケープは<>&のみだった）

• 入力があればhtmlエスケープ+改行<br/>変換

• html表示はそのままhtmlエスケープ+改行<br/>変換状態で出力

• DBにそのままhtmlエスケープ+改行<br/>変換状態で出力入れる

• htmlフォーム内表示はhtmlエスケープを解除し表示

↓

入力値はそのままinput変数に保持

confirm画面でエスケープ (html.escape()+改行<br/>変換) しescape変数に保持

DB保存時にはescape変数にプラスしてダブル/シングル/バッククォート、セミコロン、バックスラッシュをエスケープし保存

DBから取り出す際はそれらをアンエスケープしescape変数に保持

Docへはinput変数で保存

画面表示時はアンエスケープ (改行<br />変換+html.unescape())

def escapeHtmlBr(text):

if text is None:

return text

elif isinstance(text, list):

list_escaped = [html.escape(item) for item in text]

list_escaped [item.replace("\n', '<br>') for item in list_escaped]

return list_escaped

else:

escaped_text = html escape(text)
return escaped_text.replace('\n', '<br>')

def unescapeHtmlBr(text):

if text is None:

return text

elif isinstance(text, list):

list_unescaped = [item.replace('<br>', '\n') for item in text]

list_unescaped = [html.unescape(item) for item in list_unescaped]

return list_unescaped

else:

text text.replace('<br>', '\n')

return html.unescape(text)

def escapeDB(text):

if text is None:

return text

elif isinstance(text, list):

list_escaped = [item.replace(';', '&semi;') for item in text]

list_escaped = [item replace('"', '"') for item in list_escaped]

list_escaped = [item.replace("'", ''') for item in list_escaped]

list_escaped = [item.replace('\\', '\') for item in list_escaped]

list_escaped = [item.replace('`', '`') for item in list_escaped]

return list_escaped

else:

escaped_text = text.replace(';', '&semi;')

escaped_text = escaped_text.replace('"', '"')

escaped_text = escaped_text.replace("'", ''')

escaped_text = escaped_text.replace('\\', '\')

escaped_text = escaped_text.replace('`', '`')

return escaped text

def unescapeDB(text)

if text is None

return text

elif isinstance(text, list):

list_unescaped = [item replace('`', '`') for item in text]

list_unescaped [item.replace('\','\\') for item in list_unescaped]
list_unescaped [item.replace(''', "'") for item in list_unescaped]

list_unescaped [item.replace('"', '"') for item in list_unescaped]

list_unescaped [item.replace('&semi;', ';') for item in list_unescaped]

return list_unescaped

else:

unescaped_text = text.replace('`','`')

unescaped_text = unescaped_text.replace('\', '\\')

unescaped_text = unescaped_text.replace(''', "'")

unescaped_text unescaped_text replace('"', '"')

unescaped_text = unescaped_text.replace('&semi;', ';')

return unescaped_text

■文字確認

def check_special_characters(a):|

#チェックする記号のセット

special_characters = ['<', '>', '"', '&']

#特定の記号が含まれているかをチェック

if any(char in a for char in special_characters):

raise ValueError(f"変数 'a' に禁止されている文字が含まれています: {a}")

try:

a = "Hello & World"

check_special_characters(a)

except ValueError as e:

print(e)

■DBのnull行の排除

bq = bigquery.Client()

sql = f"""SELECT a FROM `ds.b' WHERE c = '{pri}'"""

results=bq.query(sql)

list = list()

for row in results:

if row.a is not None:

list.append(str(row.a))

■Flask-WTF CCSRF対策でhiddenに入れる

https://qiita.com/RGS/items/c8c99970054a481ac80d

requrement.txt Flask-WTF==1.2.1

from flask_wtf import CSRFProtect

app = Flask(__name__)

app.config['SECRET_KEY'] = 'mysecretkey'

csrf = CSRFProtect(app)

PRGパターンでGETで完了画面に行くがエラーとならない、WTFはPOSTのみ利くようだ

●完了画面でセッション変数がない場合はエラーとする

保存処理でdoc_idをセッション変数に入れ

不正で直接完了画面にいくとエラーとする

https://xxxx.com/complete?doc id=ddd

■重複登録の回避策(PRG方式+JSボタン無効)

・リダイレクト POST/Redirect/GET パターン

・連打を避けるためボタンのJS無効化

片方のみのためquerySelectorAll() を使う>ページ遷移しなくなった>下記JSを使う

@app.route('/submit', methods=['POST'])

def page():

page = model

if complete:

session['doc_id'] = page['input']['doc_id']

redirect(url_for('thank_you'))

else:

retrun template('layout.html')

@app.route('/thank_you')

def thank_you():

if 'doc_id' in session:

page['input']['doc_id"] = session['doc_id"]

session clear()

return render_template('complete_layout.html', page=page)

else:

return render_template('error.html", message="missing arg")

@app.errorhandler(404)

def page_not_found(e)

return render_template('error html', message="Page not found"), 404

error.html側

<h1>{{message }}</h1>

submit側

連打を避けるためボタンの無効化

片方のみのためquerySelectorAll() を使うとページ遷移しなくなる等がある

document.addEventListener('DOMContentLoaded', function(){

const form = document.getElementById('form');

const buttons = form.getElementsByTagName('button');

form.onsubmit= function(event) {

//クリックされたボタンを取得

const clickedButton = event.submitter;

//隠しフィールドを追加して、ボタンのname と value を送信

const hiddenField = document.createElement('input');

hiddenField type = 'hidden'

hiddenField.name = clickedButton.name;

hiddenField.value = clickedButton value;

form.appendChild(hiddenField);

// すべてのボタンを無効化して二重送信を防止

for (let i = 0; i < buttons.length; i++) {

buttons[i].disabled = true;

}

</script>

Posted by funa : 11:34 PM | Web | Comment (0) | Trackback (0)

June 21, 2024

あそびはここで終わりにしようぜ～

Big Table

Cloud Bigtableを触ってみよう - Uzabase for Engineers

でっかいテーブル、読み書き低レイテンシー、RDBは負荷高いときにレプ数位でスケールが難しいがBTはするので正規化せずに単一テーブルにしておく感じ

row keyが主役

データを追加するのに3パターンある(行追加、列追加、セル追加)

　行に複数カラムファミリーにカラムが幾つか入れられるのでKVSだが結局Where句みたいに使う?

　　行キー「企業ID#日付」,COLUMN FAMILY「STOCK PRICE」,COLUMN「HI PRICE」「LO PRICE」に対してJSONデータを入れておく等

　　時間はバージョン管理として持っている

　複雑な条件は無理でデータを事前整理して入れておき、JSONカラムを使ったりで一行にまとめスキャンを一発で済ます等で高スループットのみ

　　Google検索のようにキーワードを入れると、検索結果が数多く一瞬で返る等

　　複雑な条件はDataprocを使うらしい

Big table構成

Bigtableを徹底解説！ - G-gen Tech Blog

インスタンスの中に一つ以上のクラスタ(ゾーン別に設定しレプリケーション)> 各クラスタには1つ以上の同数のノード

　クラスタに table > 複数Column family > 複数Column > セル

bigtable_app_profilesで転送クラスタ先の設定する(単一行トランザクション設定を含む)

　－マルチクラスタ(自動フェイルオーバ、単一行transaction不可でレプリケーションによる不整合あり)

　－シングルクラスタ(手動フェイルオーバ、一行transaction)

デフォルトをマルチにして、通常のクラスタ転送をシングル、問題があるときだけアプリで判定しマルチに行く

Bigtableで複数クラスタ構成におけるデータ整合性の保証 - Carpe Diem (hatenablog.com)

スキーマ:

　テーブル

　行キー(row key)

　カラムファミリー(カページコレクションポリシーを含む)

　カラム

更新したデータはタイムスタンプによりセル内で保存される

　解消するにはガベージコレクション

　　期限切れ値、バージョン数で設定する

仕様：

KVS、行指向の行単位でスキャン

各テーブルのインデックス (行キー)は1つのみで一意である必要がある

行は、行キーの辞書順に並べ替えられます。

列は、列ファミリー別にグループ化され、列ファミリー内で辞書順に並べ替えられます

列ファミリーは特定の順序では保存されません

集計列ファミリーには集計セルが含まれます

行レベルでアトミック (複数行だと知らんという意)

　アトミック性:トランザクション整合性がある（一部の操作だけ実行した状態とならずに）
特定の行にread/writeが集中するより分散が良い

Bigtable のテーブルはスバース、空白行での消費はない

cbt CLI の概要 | Bigtable Documentation | Google Cloud

cbt リファレンス | Bigtable Documentation | Google Cloud

gcloud components update

gcloud components install cbt

(-/cbtrcに以下記載すれば-projectと-instance はデフォルト値で省略できる)

cd ~

echo project unco > ~/.cbtrc

echo instance = chinco >> ~/.cbtrc

cbt -project unco listinstances

cbt -instance chinco listclusters

cbt -project unco -instance chinco ls | grep kuso-t

　テーブル名取得

cht -project unco -instance chinco ls kuso-table

　カラムファミリやポリシー等取得

cbt -project unco -instance chinco deletefamily kuso-table shikko-family

cbt -project unco -instance chinco deletetable kuso-table

　テーブルを消せばカラムファミリも削除になる

Posted by funa : 11:00 PM | Web | Comment (0) | Trackback (0)

June 2, 2024

Cloud SQL

■Cloud SQL Python Connector (Cloud SQL language Connector)

CloudSQL auth proxyのバイナリインストールでないやり方
Cloud SQL Python Connector自体は暗号化しないが、内部IPならサーバレスVPCコネクタで暗号化された通信が使え安全になっている。外部IPアドレスの場合はCloud SQL Auth Proxyで通信を暗号化。

Cloud SQL 言語コネクタの概要 | Cloud SQL for MySQL | Google Cloud
GitHub - GoogleCloudPlatform/cloud-sql-python-connector: A Python library for connecting securely to your Cloud SQL instances.

事前必要(pip install>requirements.txt)

Flask==3.0.3

gunicorn==22.0.0

Werkzeug==3.0.3

google-cloud-bigquery==3.25.0

google-cloud-logging==3.11.1

google-cloud-secret-manager==2.20.2

google-api-python-client==2.141.0

google-auth-httplib2==0.2.0

google-auth-oauthlib==1.2.1

websocket-client==1.8.0

google-cloud-resource-manager==1.12.5

Flask-WTF==1.2.1

cloud-sql-python-connector==1.16.0

pymysql==1.0.3

from flask import Flask, jsonify

from google.cloud.sql.connector import Connector

from google.cloud import secretmanager

import pymysql

# 環境変数の定義

PW_NAME = "sql-pw"

PROJECT_NUM = "1234567890"

DB_INSTANCE = "prj:asia-northeast1:db_instance"

DB_USER = "db-user"

DB_NAME = "db001"

# Secret Manager からパスワードを取得する関数

def get_pw(pw_name, project_num):

client = secretmanager.SecretManagerServiceClient()

resource_name = f"projects/{project_num}/secrets/{pw_name}/versions/latest"

res = client.access_secret_version(name=resource_name)

credentials = res.payload.data.decode("utf-8")

return credentials

# Cloud SQL接続

def sql_getconn(connector):

pw = get_pw(PW_NAME, PROJECT_NUM)

conn = connector.connect(

DB_INSTANCE,

"pymysql",

user=DB_USER,

password=pw,

db=DB_NAME,

ip_type="private",

)

return conn

app = Flask(__name__)

@app.route('/test', methods=['GET'])

def get_table_data():

try:

connector = Connector()

conn = sql_getconn(connector)

cursor = conn.cursor()

# SQLを実行して結果を取得

cursor.execute("SELECT no, name, targetDate FROM test")

rows = cursor.fetchall()

# 結果をJSON形式に変換

result = [

{

"no": row[0],

"name": row[1],

"targetDate": row[2].strftime("%Y-%m-%d %H:%M:%S") if row[2] else None

}

for row in rows

]

cursor.close()

conn.close()

return jsonify(result), 200

except Exception as e:

return jsonify({"error": str(e)}), 500

if __name__ == "__main__":

app.run(host="0.0.0.0", port=8080)

=============

# 追加オプションを使った接続も可

connector = Connector(

ip_type="public", # "private" または "psc" も使用可能

enable_iam_auth=False,

timeout=30,

credentials=None, # 必要ならGoogle認証情報を渡す

refresh_strategy="lazy", # "lazy" または "background"

)

#トランザクション

try:

conn = sql_getconn(connector)

conn.autocommit = False # トランザクション開始、あるいは conn.begin()

cursor = conn.cursor()

# 挿入するデータを準備

new_data = [

{"no": 4, "name": "新しい名前4", "targetDate": "2024-05-01"},

{"no": 5, "name": "新しい名前5", "targetDate": "2024-05-02"},

]

# INSERT文を構築して実行

for data in new_data:

sql = "INSERT INTO test (no, name, targetDate) VALUES (%s, %s, %s)"

values = (data["no"], data["name"], data["targetDate"])

cursor.execute(sql, values)

conn.commit() # トランザクションをコミット

print("Data inserted successfully.")

except Exception as e:

conn.rollback() # エラーが発生した場合はロールバック

print(f"Transaction rolled back due to an error: {e}")

finally:

cursor.close()

conn.close()

#カーソル

cursor = conn.cursor(cursor=pymysql.cursors.DictCursor)

　params: dict形式で取得#[{'no': 1, 'name': 'Alice',...}, ...]

cursor = conn.cursor(cursor=pymysql.cursors.SSCursor)

　大量のデータを効率的に取得するためにストリーミングで結果を処理

cursor.execute(query, params=None)

　cursor.execute("SELECT * FROM test WHERE no = %s", (1,))

　params: プレースホルダーに対応する値のタブルまたはリスト

cursor.executemany(query, param list)

　cursor.executemany("INSERT INTO test (no, name) VALUES (%s, %s)", [(1, 'Alice'), (2, 'Bob')])

　param list:繰り返し実行するパラメータのリストまたはタブルのリスト

cursor.fetchone()

　row = cursor.fetchone()

　#結果があれば (1, 'Alice', "2025-01-01") のような形式で1行のみ取得

cursor.rowcount

　print(cursor.rowcount) #影響を受けた行数を返す

■接続検証用コンテナをビルド (内部IPを使うrun用)

gcloud builds submit --tag asia-northeast1-docker.pkg.dev/prj/artifact_reg_name/app_name

■IAM？
Cloud SQL設定にCloud SQL 管理者 (roles/cloudsql.admin)、Cloud SQL インスタンスユーザー (roles/cloudsql.instanceUser)等のIAMが要る?

IAMユーザならいる、ローカルUserなら不要と思われる、ローカルでもCloud SQL Client (roles/cloudsql.client)等は要る

■Cloud SQL MySQL設定

【開発環境】db_instance01

Enterprise / Sandbox / AsiaNorthEast1 (Tokyo) / Single zone

MySQL ver 8.4

Shared core/1cpu 0.6GB/HDD/10GB(auto increase)

PrivateIP/設定にnwが必要(下記)/Enable private path

Auto daily backup 7days (1-5AM) / Enable point-in-time recovery

Week1 sun 0-1am/Enable query insights

root PW: 69696969

【本番環境】

Enterprise plus? キャッシュ使う?

※CloudSQLはTFファイルに記載がなくてもTFステートファイルにPWを含めてしまうためTF化しない

- NW: projects/prj/global/networks/sql-vpc-nw

- Connection name: prj:asia-northeast1 db_instance01

ユーザの作成 sql-user/82828282

　PWをコードに入れない、シクレMgrに保存

■MySQL

utf8mb4_ja_0900_as_ci_ksを使う？

MySQL 8.0のCharset utf8mb4での日本語環境で使うCollationで文字比較をしてみる - CLOVER🍀

_ai... アクセントを区別しない (Accent Insensitive)

_as... アクセントを区別する (Accent Sensitive)

_ci... 大文字・小文字を区別しない (Case Insensitive)

_cs... 大文字・小文字を区別する (Case Sensitive)

_ks... カナを区別する (Kana Sensitive)

_bin... バイナリ

utf8mb4_unicode_ciでは"ア”と“あ”は同じものとして扱われる

utf8mb4_ja_0900_as_ci_ks では"ア"≠”あ”となりカタカナとひらがなを明確に区別できる

utf8mb4_ja_0900_as_ci_ks ならふりがなを使った並び替えで有効

日本語のデータがメインで検索やソートでひらがな・カタカナ・濁点の区別が必要なら utf8mb4_ja_0900_as_ci_ks が適

日本語と英語を混ぜたデータや広く互換性を持たせたいなら utf8mb4_unicode_ci の方が無難

インデックスをどのカラムに作ればいいか迷った時の３つの設計方針 #DB - Qiita

テーブルレコード数が1万件以上

全体のレコード数の5%程度に絞り込めるカーディナリティ高さ

WHERE句の選択条件、または結合条件

主キーおよびユニークの列には作成が不要

インデックスは更新性能を劣化させる

データベースとテーブルの作成

CREATE DATABASE db;

USE db;

CREATE TABLE test (

no INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,

name VARCHAR(8) NOT NULL,

targetDate TIMESTAMP NOT NULL,

PRIMARY KEY (no),

INDEX index_name (name),

INDEX index_targetDate (targetDate)

)

ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_ja_0900_as_ci_ks;

ENUM型は選択肢で早いがALTERが面倒なのでvarcharaにする

inquiry_type ENUM('bq', 'pii') NOT NULL

↓

inquiry_type VARCHAR(255) NOT NULL,

VARCHAR(255) (よく使われる最大サイズ)

VARCHAR(1024) (長めの文字列)

VARCHAR(4096) (長文向け)

長いテキストを扱うならTEXT型

InnoDB の1行の最大サイズは約8KB (8126/バイト)

長さは?メールは255で良い

サンプルデータ

INSERT INTO `table` (`name`, `date`) VALUES ('aaa', '2002-02-23');

ORMapperは面倒なのでSQLを使う
ORM Quick Start — SQLAlchemy 2.0 Documentation
【SQLAlchemy】Generic Typesと各種DBの型対応表
SQLAlchemyでのテーブル定義 #Python - Qiita

■データベースフラグ
confが直接変更できなためフラグとしてパラメータを渡せる

データベースフラグを構成する | Cloud SQL for MySQL | Google Cloud

　Cloud SQL studio (コンソールでMySQLが使える)

　　MySQLクライアントを使いたいならAuth proxyが必要

　HA構成だとフェールオーバーやリードレプリカ等が使える

■NW
Cloud SQLを徹底解説！ - G-gen Tech Blog

Cloud SQLが内部IPだとサーバレスVPCコネクタ、or 外部IPならSQL + auth proxy

内部IPで良いのでVPCを作る、CloudSQLを内部IPで作る

サーバレスVPCアクセスコネクタを作る

　vpc: sql-vpc-nw, subnet: sql-vpc-subnet 192.168.77.0/24

　　Gateway 192.168.77.1, Private Google Access On

　　sql-vpc-nw-ip-range 192.168.78.0/24 on cloudSQL

　　run-serverless-vpc-ac 192.168.79.0/28 on Run

ファイアウォールルールでポート (デフォルトで3306など) を開放

Cloud Run のNW設定で、サーバーレス VPCコネクタを選択、ルートオプションとしてすべてのトラフィックを VPC コネクタ経由で送信を選択

CloudSQLを30分程度掛けて起動、接続＞接続テスト

VPC（例: 10.0.0.0/16）

サブネット（Cloud SQL 用）: 10.10.0.0/24（例: us-central1、VPC内）

サブネット（VPCコネクタ用）: 10.8.0.0/28（RunからVPCへ通信用、VPC外）

　VPC コネクタのサブネットは 10.8.0.0/28 のような小さな範囲を使用、VPC外だがrun自体がVPC外だから？

　VPC コネクタはリージョン単位なので、Cloud Run と Cloud SQL を同じリージョンに配置するのが望ましい

Google Cloudの内部NW設計によりVPC内の異なるサブネット間でも通信可能

　VPC内なら異なるリージョンのサブネットでもOK（VPC自体には範囲を設定なしでサブネットでIPが被らなければOKかと

　追加の設定なしで、例えば us-central1 の VM から asia-northeast1 の Cloud SQLに直接アクセス可

外部IPの場合：

アプリがrunならサイドカーコンテナとしてAuth Proxyを追加できる

　サイドカーは同Pod内なのでループバックアドレス127.0.0.1あるいはlocalhost:5432 (Auth Proxy起動時に指定したポート) に通信しCloudSQLに接続する

GCEにDLしてAuth proxyインストールでもいい

　アプリのコネクタはAuth Proxy動いているGCEのIP:ポート番号を指定に通信しCloudSQLに接続する

　FWでポートも開けること

■run サービスアカウント

run-sql@prj.iam.gserviceaccount.com に必要な権限

　Cloud SQL Client (roles/cloudsql.client)

　Run Invoker (roles/run.invoker)

　Compute Network User (roles/compute.networkUser) -VPCコネクタを使用する

runを建てるが、InternalIPのため同プロジェクト同VPCのGCE を作成し移動してCURLでテスト

curl -H "Authorization: Bearer $(gcloud auth print-identity-token)" "https://run-sql-test-1212124.asia-northeast1.run.app/test"

■MySQLでUUIDを使うか、連番を使うか? > ULIDを使う

UUIDは連番に対し

　セキュリティ上より安全、サーバが異なってもユニーク

　パフォーマンスが悪い (UUIDをプライマリキーにすると速度が落ちる場合がある)

連番とUUIDの両方を振り出しておく? > ULIDを使うことにする

MySQLでUUIDv4をプライマリキーにするとパフォーマンス問題が起きるのはなぜ？（N回目）

Posted by funa : 01:06 PM | Web | Comment (0) | Trackback (0)

June 1, 2024

GCP hands-off 3

■VPC（例: 10.0.0.0/16）

サブネット（Cloud SQL 用）: 10.10.0.0/24（例: us-central1、VPC内）

サブネット（VPCコネクタ用）: 10.8.0.0/28（RunからVPCへ通信用、VPC外）

　VPC コネクタのサブネットは 10.8.0.0/28 のような小さな範囲を使用、VPC外だがrun自体がVPC外だから？

　VPC コネクタはリージョン単位なので、Cloud Run と Cloud SQL を同じリージョンに配置するのが望ましい

Google Cloudの内部NW設計によりVPC内の異なるサブネット間でも通信可能

　VPC内なら異なるリージョンのサブネットでもOK（VPC自体には範囲を設定なしでサブネットでIPが被らなければOKかと

　追加の設定なしで、例えば us-central1 の VM から asia-northeast1 の Cloud SQLに直接アクセス可

■対象アセットに対する付与可能なロールの一覧表示

リソースに対して付与可能なロールの表示 | IAM Documentation | Google Cloud

Full Resource Name（フルでのアセット名を探せる）

Asset names | Cloud Asset Inventory Documentation | Google Cloud

import google.auth

import googleapiclient.discovery

def view_grantable_roles(full_resource_name: str) -> None:

credentials.google.auth.default(

scopes=["https://www.googleapis.com/auth/cloud-platform"]

)

service = googleapiclient.discovery.build('iam', 'v1', credentials credentials)

roles = (

service roles()

queryGrantableRoles (body=["fullResourceName": full_resource_name}).execute()

)

for role in roles["roles"]

if "title" in role:

print("Title: role["title"])

print("Name: role["name"])

if "description" in role:

print("Description:" + role["description"])

print("")

project_id = "prj"

#resource = f"//bigquery.googleapis.com/projects/prj/datasets/ds"

#resource + f"//bigquery googleapis.com/projects/prj/datasets/ds/tables/tbl"

resource = f"//cloudresourcemanager.googleapis.com/projects/{project_id}"

view_grantable_roles(resource)

■ロールの一覧表示

https://cloud.google.com/iam/docs/roles-overview?hl=ja#role-types

1)事前定義ロールの場合は roles.get() を使用します。

2)プロジェクトレベルのカスタムロールの場合は、projects.roles.get() を使用します。

3)組織レベルのカスタムロールの場合は、organizations.roles.get() を使用します。

　これら3種類で全てを網羅すると思われます

　projectIDがsys-のものはGAS、lifecycleStateがACTIVE以外のものも含まれるので注意

■bqへの書き込み

export GOOGLE_APPLICATION_CREDENTIALS="path/to/your-service-account-key.json"

pip install google-cloud-bigquery

from google.cloud import bigquery

client = bigquery Client()

#書き込み先のテーブル情報

table_ref = f"{project_id}.{dataset_id}.{table_id}"

#サンプルデータの生成

def generate_sample_data(num_rows)

data = [

{

"organization": f"org_(num_rows)",

"permission". "view",

}

for _ in range(num_rows)

]

return data

data_to_insert = generate_sample_data(5000)

errors = client.insert_rows_json(table_ref, data_to_insert)

if errors:

print("Errors occurred: {errors}")

else:

print("Data successfully written to BigQuery!")

■データカタログ

データアセットを検索する | Data Catalog Documentation | Google Cloud
Class SearchCatalogRequest (3.23.0) | Python client library | Google Cloud
サンプルで仕様書のAPIを使っているがqueryが空白刻みで入れる等の使い方が分かる

■BQスキーマ+ポリシータグ取得

from google.cloud import bigquery

def get_policy_tags_from_bq_table(project_id, dataset_id, table_id):

print("################ bigquery.Client.get_table().schema start ################")

print(f"Target table: {project_id}.{dataset_id}.{table_id}")

bq_client = bigquery.Client()

table = bq_client.get_table(f"{project_id}.{dataset_id}.{table_id}")

schema = table.schema

policy_tags = []

for field in schema:

print(f"Column: {field.name}")

if field.policy_tags:

tags = [tag for tag in field.policy_tags.names]

policy_tags.extend(tags)

print(f"Policy Tags: {tags}")

else:

print("> No Policy Tags assigned.")

return policy_tags

PROJECT_ID = "prj"

DATASET_ID = "ds"

TABLE_ID = "test001"

policy_tags = get_policy_tags_from_bq_table(PROJECT_ID, DATASET_ID, TABLE_ID)

print("Collected Policy Tags:", policy_tags)

■ポリシータグ設定

from google.cloud import datacatalog_v1

from google.cloud import bigquery

PROJECT_ID = "prj"

DATASET_ID = "ds"

TABLE_ID = "tbl01"

COLUMN_NAME = "aaa"

POLICY_TAG_PROJECT = "prj"

POLICY_TAG_NAME = "projects/prj/locations/us/taxonomies/83893110/policyTags/11089383"

def list_taxonomy_and_policy_tag():

print("############# Start #############")

list_policy_tags = []

client = datacatalog_v1.PolicyTagManagerClient()

request = datacatalog_v1.ListTaxonomiesRequest(

parent=f"projects/{POLICY_TAG_PROJECT}/locations/us"

)

try:

page_result = client.list_taxonomies(request=request)

except google.api_core.exceptions.PermissionDenied as e:

print(f"Skipping project {POLICY_TAG_PROJECT} due to PermissionDenied error: {e}")

return []

except Exception as e:

print(f"An error occurred for project {POLICY_TAG_PROJECT}: {e}")

return []

for taxonomy in page_result:

print(f"############ Taxonomy display_name: {taxonomy.display_name} #############")

print(f"############ Taxonomy name: {taxonomy.name} #############")

request_tag = datacatalog_v1.ListPolicyTagsRequest(parent=taxonomy.name)

try:

page_result_tag = client.list_policy_tags(request=request_tag)

except Exception as e:

print(f"Error on {request_tag}: {e}")

break

for policy_tag in page_result_tag:

print("Policy tag:")

print(policy_tag)

list_policy_tags.append({

"project_id": POLICY_TAG_PROJECT,

"taxonomy_display_name": taxonomy.display_name,

"taxonomy_name": taxonomy.name,

"policy_tag_name": policy_tag.name,

"policy_tag_display_name": policy_tag.display_name,

})

return list_policy_tags

def update_table_schema_with_policy_tag(list_policy_tags):

for policy_tag in list_policy_tags:

if policy_tag['policy_tag_name'] == POLICY_TAG_NAME:

print(

f"Target policy tag:\n"

f" Project ID: {policy_tag['project_id']}\n"

f" Taxonomy Display Name: {policy_tag['taxonomy_display_name']}\n"

f" Taxonomy Name: {policy_tag['taxonomy_name']}\n"

f" Policy Tag Name: {policy_tag['policy_tag_name']}\n"

f" Policy Tag Display Name: {policy_tag['policy_tag_display_name']}"

)

client = bigquery.Client()

table_ref = f"{PROJECT_ID}.{DATASET_ID}.{TABLE_ID}"

table = client.get_table(table_ref)

new_schema = []

for field in table.schema:

if field.name == COLUMN_NAME:

new_schema.append(

bigquery.SchemaField(

name=field.name,

field_type=field.field_type, # Keep original field type

mode=field.mode, # Keep original mode

description=field.description,

policy_tags=bigquery.PolicyTagList([POLICY_TAG_NAME]),

)

else:

new_schema.append(field)

table.schema = new_schema

updated_table = client.update_table(table, ["schema"])

print(

f"Updated table {updated_table.project}.{updated_table.dataset_id}.{updated_table.table_id} schema\n"

f"with policy_tag {POLICY_TAG_NAME} on the column {COLUMN_NAME} successfully."

)

if __name__ == "__main__":

list_policy_tags = list_taxonomy_and_policy_tag()

update_table_schema_with_policy_tag(list_policy_tags)

■KSA問題

ブログ内で情報が分散、まとめたい
ワークロード毎にKSA１つ
ksaのtokenはk8s api用でgcp apiに使えない、exprireしない問題がある> Workload identity で解決する

Workload Identity は KSAとGSAの紐づけで、Workload Identity Federationとは違う

workloads がk8sの用語でリソースの総称で、そのidentityであり権限管理、でFederationは更に外部連携

　ワークロードは、pod, deplyment, StatefulSet, DaemonSet, job, CronJob, ReplicationController, ReplicaSet

Workload Identity がGKE クラスタで有効化されると、gke-metadata-server という DaemonSet がデプロイ

gke-metadata-server は Workload Identity を利用する上で必要な手続きを実行

SAの紐づけ

/// 現行

【Workload Identity】 GKE で Google Service Account を利用する正しいやり方 #GoogleCloud - Qiita

Workload identityを有効にして(autopilot でデフォルト有効)

GCP側でKSAとGSAをIAM policy binding

k8s側でKSAとGSAをkubectl annotate

podでKSAを設定

↓

/// 新型のKSA直接bind

新しくなった Workload Identity Federation for GKE を試してみる

workload identity federation ならGSAがなくなりKSAを直接bindできる

Workload identityを有効にして(autopilot でデフォルト有効)

GCP側でKSAにIAM policy binding

※混在するので現行のままが良いようです

■Workload identity federation（GCP外との連携）
Workload Identity Federation の仕組み

まずWIF用のSAを作成する>SAに権限を付与する>

1)Workload identity provider+SAの情報をgithub actionに埋めて使う
　GitHub Actions から GCP リソースにアクセスする用途

2)Workload identity poolから構成情報をDLしAWSアプリに埋めて使う
　AWSからGCP リソースにアクセスする用途

　　gcloud auth login-cred-file=構成情報ファイルパス

　　　gcloud CLI を承認する | Google Cloud CLI Documentation

3)Workload identity poolから構成情報をEKSのOIDC ID token のパスを指定しDL
　EKS から GCP リソースにアクセスする用途

- EKSのマニフェストのサービスアカウントのアノテーションにIAMロールを記載

- EKSのサービスアカウントを使用したい Podのアノテーションに追加

- マウント先のパスを環境変数 GOOGLE APPLICATION_CREDENTIALS に設定

- Pod内でSDK またはコマンドにてGCP リソースヘアクセス可能か確認

Posted by funa : 03:24 PM | Web | Comment (0) | Trackback (0)

May 9, 2024

Pubsub

■pubsub

Publisher app → |GCPの壁| Topic(Schema) → Subscription 1や2 |GCPの壁| → Subscriber app
　サブスクライバーappにPull/PushさせるPull/Pushのサブスクリプションをトピックに紐づける設定をしておく

【図解付き】Cloud Pub/Subに概要や使い方についてわかりやすく解説 - KIYONO Engineer Blog (kiyono-co.jp)

Pub/Sub サービスの概要 | Pub/Sub ドキュメント | Google Cloud

GCPのCloud PubSubで考慮すること - Carpe Diem (hatenablog.com)

Pub/Sub の割り当てと上限 | Pub/Sub ドキュメント | Google Cloud

アプリで簡単にPubsubにパブリッシュや、サブスクもできるので、アプリ間の連携にPubsubが使える

　• 非同期処理(画像処理とか重めのもの

　• IDの種類 (message id, subscription id, topic id, ack id, project idあたりがアプリでは使われるっぽい

　　※ack idはpull時のみでPushのときはhttpステータスコードが200でackとなる

GCP - Pub/Sub サービス概要 #GoogleCloud - Qiita

Pub/Sub メッセージの作成とレスポンス | Python 用 App Engine フレキシブル環境に関するドキュメント | Google Cloud

トピック（メッセージのパブリッシュ先）
　• スキーマ/外部アクセス許可/リテンション/GCS/バックアップの設定がある (Push/Pullの設定はない)

　• パブリッシュ側のベストプラクティス (JWT)

　　Pub/Sub トピックにパブリッシュするためのベストプラクティス | Pub/Sub ドキュメント | Google Cloud

サブスクライバのPushとPull (PushはEndpointが必要、デフォルトはpull)

　GCP - Pub/Sub サービス概要 #GoogleCloud - Qiita

　• at-least-once (少なくとも1回) 配信を提供します

　• 同じ順序指定キーを持ち、同じリージョンに存在している場合は、メッセージの順序指定を有効にできます

　• サブスクライバーが31日間未使用、またはサブスクリプションが未更新の場合、サブスクリプションは期限切れ

　• メッセージ数が多いとpull向きサブスクリプションタイプを選択する | Pub/Sub ドキュメント | Google Cloud

pushはhttpsが必要?

　push サブスクリプションを作成する | Pub/Sub ドキュメント | Google Cloud

　• push エンドポイントのサーバーには、認証局が署名した有効な SSL証明書が必要でhttps

　• Cloud run でEvent Arcを設定するとサブスクが自動作成されrunのデフォルトhttpsのURLが使われるが、これはPullよりPushで安定した

　• CronバッチならPullで安定するのでは?大量リクエストはPull向きとある(Pullは失敗処理込みの話かも知れん)

トピックのリテンション:デフォルトなし、最小値:10分、最大値:31日

サブスクのリテンション:デフォルト値:7日、最小值:10分、最大値:7日

　サブスクリプションプロパティ | Pub/Sub ドキュメント | Google Cloud

pubsub ack期限(Ack Deadline)
　•デフォルト60秒> 設定10分>ack延長で最大1時間まで伸ばせると思われる

　リース管理で確認時間を延長する | Pub/Sub ドキュメント | Google Cloud

　•exactly onceを設定しなければ期限の延長は保証されない

　•ack期限を過ぎる、あるいはNackを返す場合、メッセージは再配送される

　•ack応答期限の延長は99パーセンタイル(上位1%の値よりも小さい値のうち最大の値)で

　modifyAckDeadlineを返し、延長してもMaxExtension (ack期限を延長する最大値) 60minまで?
　　modifyAckDeadlineリクエストを定期的に発行すればよいらしい

メッセージの再試行を強制するには
　•nack リクエストを送信

　•高レベルのクライアントライブラリを使用していない場合は、ackDeadlineSeconds を0に設定して modifyAckDeadline リクエストを送信する

exactly once
1 回限りの配信 | Pub/Sub ドキュメント | Google Cloud

　•pullなら設定できる。他には、Cloud Dataflowを組み合わせる(プログラムコードでDataflowを使う感じかり、あるいはmessageについているunique idを利用して、KVS を用いたステート管理をして自前で重複を排除する

　•再配信は、メッセージに対してクライアントによる否定確認応答が行われた場合、または確認応答期限が切れる前にクライアントが確認応答期限を延長しなかった場合のいずれかか原因で発生することがある。

　　※exactly onceはエラーでも再配信でPubsubパニックしないようにしたいために使うものではない?

pubsubはトピックにPublishされたメッセージをDataflowに引き継げる

　Dataflow (Apache Beam) を大量のメッセージをバッチ処理する場合に使える

　　Pub/Sub→Dataflow→処理

　•Apache Beamのウィンドウ処理とセッション分析とコネクタのエコシスエムがある

　•メッセージ重複の削除ができる

　•pubsub>dataflow>BQやGCS: この流れでログ等をストーリミングで入れ込める

BQサブスクリプション (PubSubはBigQuery Storage Write API を使用してデータを BigQueryテーブルに送信、GCSサブスクもある)

　Langganan BigQuery | Dokumentasi Pub/Sub | Google Cloud

　BigQuery サブスクリプションの作成 | Pub/Sub ドキュメント | Google Cloud

サブスクライバーApp側のコードでのフロー制御によりちょっと待てよのトラフィック急増対応

　フロー制御を使用して一時的な急増を処理する | Pub/Sub ドキュメント | Google Cloud

デッドレタートピック (配信試行回数が見れる)やエラーでの再配信

　メッセージエラーの処理 | Pub/Sub ドキュメント | Google Cloud

　 • Pub/Subサブスクリプションにデッドレタートピックを設定しておくと、一定の回数再送信が失敗したメッセージの宛先がデッドレタートピックに変更され貯められる

メッセージのフィルタ、同時実行制御により多いメッセージに対応

　サブスクリプションからのメッセージをフィルタする | Pub/Sub ドキュメント | Google Cloud

Pubsubをローカルでエミュレートする

　エミュレータを使用したローカルでのアプリのテスト | Pub/Sub ドキュメント | Google Cloud

pubsubのスナップショットやリテンション

クイックスタート: スナップショットまたはタイムスタンプまでシークして Pub/Sub でメッセージを再生する | Pub/Sub ドキュメント | Google Cloud

トピックにリテンションを設定しスナップショット作成> 過去のサブスクしたメッセは見えなさそう

サブスクにリテンションを設定しスナップショット作成> 過去のAckしたメッセは見えなさそう

スナップショットでどう使うのか?

　cloud pubsubで配信済みのメッセージを再送する #PubSub - Qiita

　キューがたまっているときに撮るものと思われる。またシーク時間のポイントを設定する意味がある

　スナップショットとシークを使いこなして特定期間の再実行を行う機能

　　スナップショットで再実行する

　　シークは指定時間か最後のスナップショット以降のサブスク再実行(実際pushでrunが再実行された)

Pubsubにどんなメッセージが入ってきているか確認する方法

　pull形式ならAckしなければpullボタンで拾い見れる (トピックでパブリッシュしてサブスクでPull し見る)

　トラブルシュートはログを見るかデッドレタートピックかGCSバックアップを見る?

デッドレターキュー(ドロップしたものの確認と救済?)

　サブスクでDLQのONしデッドレタートピックを設定し転送する>GCSにもバックアップできる

　DLTでメッセージ(実行済みOR未実行)の再生

データ形式:スキーマを使うか、スキーマなしならdataで取得できる

　トピックのスキーマを作成する | Pub/Sub ドキュメント | Google Cloud

　Cloud Pub/Subの概要とPythonでの実践 - case-kの備忘録

from google cloud import pubsub_v1

from avro.io import DatumReader, BinaryDecoder

from avro schema import Parse

project_id="your-project-id"

subscription id="your-subscription-id"

subscriber pubsub_v1.SubscriberClient()

subscription_path = subscriber.subscription_path(project_id, subscription_id)

avro_schema = Parse("""

{

"type": "record",

"name": "Avro".

"fields": [

{

"name": "ProductName",

"type": "string",

"default":""

{

"name": "SKU",

"type": "int",

"default": 0

}

def callback(message):

print(f"Received message: {message}")

reader = DatumReader(avro_schema)

decoder = Binary Decoder (message.data)

avro_record = reader.read(decoder)

message_id=message.message id

message.ack()

print("Message ID: (message_id}")

product_name = avro_record['ProductName']

sku= avro_record['SKU']

print("Product Name: (product_name}")

print("SKU: (sku}")

subscriber.subscribe(subscription_path, callback=callback)

def callback(message):

print("Received message: (message)")

data message data

message_id=message.message_id

message.ack()

print("Date (data)")

print("Message ID: (message_id)")

Pub/SubでStreamingPull APIを使用してメッセージをリアルタイムで処理する - G-gen Tech Blog

StreamingPull API を使用するとアプリとの間で永続的な双方向接続が維持され、Pub/Sub でメッセージが利用可能になるとすぐに pullされる。1 つの pull リクエストで 1 つの pull レスポンスが返る通常の単項 Pull と比較すると、高スループット・低レイテンシ。必要なメッセージを残す処理をしたりも？GCP側の問題であっても通信が切れた場合は別サーバに繋ぎなおすためmodifyAckDeadlineも切れ再配信されるバグがある

＋＋＋

メッセージのTTL (Time-To-Live) はメッセージ保持期間(message retention duration) に依存

メッセージが TTLを超えると、自動的に削除され、Subscriberが受信できなくなる

ackDeadlineSeconds (デフォルトは10秒、最大600秒) を超えたACKのメッセージは再配信されますが、TTL期限を超えた場合は消える

#TTLを最大7日間に設定

gcloud pubsub subscriptions update my-subscription message-retention-duration=604800s

DLQ (Dead Letter Queue)
Subscriberが指定回数(最大100回) メッセージのACKを行わなかった場合に、メッセージを隔離する仕組み

DLQもサブスクなので期間やTTL設定方法は同じ

#DLQ topic 作成

gcloud pubsub topics create my-dlq-topic

#5回失敗したらDLQへ

gcloud pubsub subscriptions update my-subscription dead-letter-topic=projects/my-project/topics/my-diq-topic max-delivery-attempts=5

#DLQ subsc作成

gcloud pubsub subscriptions create my-diq-subscription--topic-my-diq-topic

#サブスクの詳細確認

gcloud pubsub subscriptions describe my-diq-subscription

#DLQメッセージの確認、-auto-ackも付けられるが、

gcloud pubsub subscriptions pull my-dlq-subscription -limit=10

[{

"ackld": "Y3g49NfY...=",

"message": {

"data": "SGVsbG8gd29ybGQ=", #Base64 エンコードされたデータ

"messageld": "1234567890",

"publish Time": "2024-02-18T12:34:56.789Z"

}

}]

#base64のでコードが必要

echo "SGVsbG8gd29ybGQ=" | base64-decode

#ack-idによりackを返しDLQメッセージを削除

gcloud pubsub subscriptions acknowledge my-diq-subscription--ack-ids=Y3g49NfFY

モニタリング > アラートポリシーから新しいアラートを作成し

pubsub.subscription.outstanding_messages を監視対象に選択し、閾値を設定するとよい

#DLQ メッセージの再処理をfunctionsに設定 (トピックに入れなおす)

from google.cloud import pubsub_v1

publisher = pubsub_v1.PublisherClient()

topic_path = publisher.topic_path("my-project", "my-topic")

def republish_message(message):

future = publisher.publish(topic_path, message.data)

print(f"Republished message ID: {future.result()}")

subscriber = pubsub_v1.SubscriberClient()

subscription_path = subscriber.subscription_path("my-project", "my-dlq-subscription")

def callback(message):

print(f"Received message: {message.data}")

republish_message(message)

message.ack()

subscriber.subscribe(subscription_path, callback=callback)

/// BANGBOO BLOG /// - GCP runs off functions pubsub on scheduler

Posted by funa : 12:00 AM | Web | Comment (0) | Trackback (0)

April 27, 2024

HELM

Helm Templateについて色々説明してみる #kubernetes - Qiita

Highway to Helm (zenn.dev)

Helmの概要とChart(チャート)の作り方 #Docker - Qiita

Helm | 一般的な慣習

helmはコマンド一発だが生k8sはマニフェストファイルの数だけkubectl apply(delete)を繰り返す必要がある

　helm upgrade chart名 -f 環境毎yamlファイル
　文法覚えるより繰り返した方がええんじゃない

helmはテンプレートフォルダ以下がマニフェスのようなもの

　ループ処理が記述可、関数が使える、関数を作れる

helmは基本はテキストの整形用と言える（ヘルパー関数やビルトイン関数を使い外部ファイルを取り込んで変形したり、変数yamlを環境yamlで上書きし外部の値を使う等で沢山のGKEアセットをループ的に生成しようとしている）

helm create <チャート名>

templates/ マニフェスト (テンプレート)

env/ 自分で作成するが環境毎に異なる値の入る変数を記述

┣dev.yaml

┣prd.yaml

values.yaml 繰り返す値等 (dev/prd.yamlが優先され上書きされる)

helm upgrade-install <release名> <Helmチャートの圧縮ファイル名>

●●helmテンプレートの文法 (.ファイル名.親.子で表す、.はルートオブジェクト、Valuesはvaluesオブジェクト、$変数:=値、ymlインデントはスペース2つ)

●templates/deployment.yaml

image: {{ .Values.deployment.image }}:{{.Values deployment.imageTag }} //nginx:latest

serviceAccountName: {{ $serviceAccountName }}-{{ $env }} //sample-sa-dev

↑

●values.yaml

deployment:

image: nginx

imageTag: latest

serviceAccountName: sample-sa

●env/dev.yaml

environment: dev
※values.yaml よりdev/prd.yamlが優先され上書きされ.Valueで使う

●●helmテンプレートのループ (range～end)

●templates/es.yaml

spec:

nodeSets:

((- range .Values.es.nodeSets }}

config:

node.attr.zone: {{ .zone }}

↑

●values yami

es:

nodeSets:

- name: node-a

zone: asia-northeast1-a

- name, node-b

zone: asia-northeast1-b

●●helmテンプレートのIF (if-end)

●templates/ingress.yaml

((- if .Values.ingress.enabled -))

apiVension: networking k8s.io/v1

kind: Ingress

{(- end }}

●env/prd.yaml

ingress:

enabled: true

●env/dev.yaml

ingress:

enabled: false

●●helmテンプレートの複数値 (toYaml、nindentは関数)

●templates/ingress.yaml

metadata:

annotations:

●values.yaml

ingress:

annotations:

kubernetes.io/ingress.global-static-ip-name: sample-ip-name

kubernetes.io/ingress.class: "gce-internal"

●●その他

中括弧内側の前後にダッシュ {{--}} をつけることができ、前に付けた場合は前の半角スペースを、後ろにつけた場合は改行コードを取り除く

hoge:

"fuga"

/* */で囲まれた部分はコメント構文

{{-/* a comment */ -}}
.Releaseでリリースの情報を使用できる
{{ .ReleaseName }}とか{{ .ReleaseNamespace }}

●●_helpers.tpl
Helmの_helpers.tplを使える人になりたい #kubernetes - Qiita

helm create [チャート名]で自動でtemplates ディレクトリに_helpers.tplが作成されるが、 partialsやhelpersと呼ばれる共通のコードブロック (defineアクションで定義されtemplateアクションで呼び出される)や、ヘルパー関数などが定義される。

_アンスコ始まりのファイルは、他のテンプレートファイル内のどこからでも利用できるという共通部品。これは内部にマニフェストがないものとみなされる。

種類としては、values.yamlが差し替え可能な変数、ローカル変数が定義したTemplateファイル内でのみ使える変数、_helpers.tplはチャート内で自由に使える変数

●templates/_helpers.tpl

apiVersion: apps/v1

kind: Deployment

metadata:

labels:

app: {{.name }}

spec:

replicas: {{ .replicas }}

selector:

matchLabels:

app: {{ .name }}

template:

metadata:

labels:

app: {{.name}}

spec:

containers:

- image: {{ .image }}

●values.yaml

nginx:

replicas: "1"

image: docker.io/nginx:1.25.1

httpd:

replicas: "3"

image: docker.io/httpd:2.4.57

●deployment-nginx.yami

{{ include "deployment" .Values.nginx }}
※{{ include "deployment" 引数 }}で関数を呼ぶ

●●英語サイトだともっと情報がある
Helm | Built-in Objects
.Filesなどのビルトインオブジェクトがあったりと、、、

GKEクラスタを作成しておく

kubectlでArgo adminとシークレット作成？

brew install argocd

Argo cd設定ファイルリポジトリのclone

argocd cluster add <context name>

argocd repo add <repo url> --ssh-private-key-path ~/.ssh/id_rsa

argocd-configuration　に設定を追加

argocd-insallation　に設定を追加

argo cd上からinstallationをsyncする

argocd login --grpc-web --sso dev-argocd.dev.bb.com

＝＝＝

ArgoはSettingsにリポジトリ、クラスター、プロジェクト、他にUserの設定

　アプリ設定でhelmのパス等を指定（Argo内部でhelm upgradeでなくkubectrl applyに変換しでやってもらえるお作法：helmコマンドのインストール不要でArgoでhelm文法が使える）

総務省｜報道資料｜「クラウドの設定ミス対策ガイドブック」の公表 (soumu.go.jp)

Posted by funa : 11:27 PM | Web | Comment (0) | Trackback (0)

January 14, 2024

GKE

モダンか何か知らんが、豚玉かイカ玉で十分じゃ

＝＝＝＝＝＝＝＝＝＝＝
kubectlチートシート | Kubernetes

フォルダに .py と requirements.txt と .dockerignore と Dockerfile を入れてアップロードしている

gcloud builds submit --tag asia-northeast2-docker.pkg.dev/bangboo-prj/xxx/image001

helloworld@bangboo-prj.iam.gserviceaccount.com 作成

アクセス元のIPを確認するCloud run作成

　ドメインないと無理なのでLBとIAPをあきらめ生成されるURLで十分

　Cloud runでアクセス元IPを表示するヤツ

　runのallUsersのinvokerを削除したらアクセス不可になった（この方法で管理する）

curl http://ifconfig.me/ で十分だったが

GKE
k8sの内部NWは通常別途いるがGKEは速い奴が動作
GKEはクラスタ内部のDNSでサービス名で名前解決できる
サービスのIPとポートは環境変数で参照可
kubectlを使うには、gcloud container cluters get-credentials　を打つ必要がある

GKE設定

-クラスタ:側の設定（IP範囲とかセキュリティとか？）

　一般/限定公開:外部IPを使うか使わないか

　コントロールプレーン承認済みネットワーク：CPにアクセスできるセキュリティ範囲

-ワークロード:マニフェストで設定

一般か限定公開か？コントロールプレーンが外部IPか？CPがグローバルアクセス可か？承認NWか？

　一般公開で承認NWが良いのでは？簡単だし、

　限定公開で使うには＞CPに外部IPで承認NWでいいのでは？

　　NW:default subnet:default

　　外部IPでアクセス許可

　　CP アドレスの範囲 192.168.1.0/28とか172.16.0.0/28(サブネット重複しない奴)

　　コントロールプレーン承認済みネットワーク home (169.99.99.0/24ではなくGCPのIPぽい)

　　限定公開ならnatが要る

　CPの VPCのIP範囲は、クラスタの VPC 内のサブネットと重複不可。CPとクラスタは VPC ピアリングを使用してプライベートで通信します

　グローバルアクセスは別リージョンからという意味っぽい、cloud shellからのkubectlのためONが良い

デフォルト設定なら作成したサブネットのIP範囲でなくクラスタが作られない

　面倒ならdefault-defaultで良いかも

サブネットをVPCネットワークを考えて指定する方が偉いかも知れんが

default asia-northeast2 10.174.0.0/20　の場合

　サブネットは　asia-northeast2 10.174.27.0/24　とか

ARにあるコンテナからGKEをデプロイが簡単にできる

Cloud Source Repositories　でソース管理gitが下記のようにできる

　gcloud source repos clone bangboo-registry --project=bangboo-prj

　cd bangboo-registry

　git push -u origin master

run使用中のコンテナがGKE上では上手くいかない runのコンテナは8080のようだ

　Dockerfileとmain.py上ではポートは何でもよい仕様だが、runで自動的に8080割り当てるようだ

　　それが駄目でありGKEは環境変数でPORT 8080を指定

　　CrashLoopBackOff問題がでる

　　https://www.scsk.jp/sp/sysdig/blog/container_security/content_7.html

デプロイ公開でポート80　ターゲットポート8080に（クラスタを作成後、ワークロードでデプロイする）

developmentのspec: containers: ports: - containerPort: 8080　を入れる？

　yamlでなく、コンソールで設定時に入れると良い

$ kubectl get all

NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE

service/flask-1-service LoadBalancer 10.48.4.134 34.97.169.72 80:32147/TCP 20m

us-docker.pkg.dev/google-samples/containers/gke/hello-app:1.0

　これは簡単に上手く行く、環境変数PORT8080不要

　クイックスタート: アプリを GKE クラスタにデプロイする | Google Kubernetes Engine (GKE) | Google Cloud

ワークロードでyamlの spec: replicas: 0を保存するとアクセスを止められる

コンフィグマップ：構成ファイル、コマンドライン引数、環境変数、ポート番号を別途持っていてPodにバインドする(マニフェストに書くと抜き出され見れる)

シークレット：Base64の値？(マニフェストに書くと抜き出され見れる）甘いのでsecret mgrを使う方が良い？

　config map/secretはマニフェストで編集する必要がある（見れるだけと思われる）

エディタで見てみる：yamlとかステータスが見れる

■LBに静的IPを振る

GKE で Ingress を使用して Google マネージド SSL 証明書を使用した外部 HTTP(S) ロードバランサを作成する - G-gen Tech Blog

hello-app-addressと名付けたIPを取得

LBのアノテーションで設定

# ingress.yaml（NWはNodePort、Route

apiVersion: networking.k8s.io/v1

kind: Ingress

metadata:

namespace: default

annotations:

kubernetes.io/ingress.global-static-ip-name: hello-app-address # IP

networking.gke.io/managed-certificates: hello-managed-cert # 証明書

kubernetes.io/ingress.class: "gce" # 外部 HTTP(S)LB

spec:

defaultBackend:

service:

port:

number: 8080

GKEでロードバランサのIPを指定するとき、グローバルに属するIPアドレスリソースは使用できないので注意 #GoogleCloud - Qiita

ServiceのLBはリージョン指定するタイプの静的IP

IngressはグローバルIPOK

apiVersion: v1

kind: Service

metadata:

labels:

app: hoge

spec:

ports:

- port: 80

selector:

app: hoge

tier: frontend

environment : stage

type: LoadBalancer

loadBalancerIP: xxx.xxx.xxx.xxx

ArmorでIP制限

１）サービスから対象を選択しingressを作成することでLBを追加しArmorも設定可能

２）デフォルトLBに付けるにはkubectl要りそう、backendconfig.yamlはどこに置く

　Cloud ArmorでGKE IngressへのアクセスをIPで制御する #GoogleCloud - Qiita

サービス画面のkubectrlから

# backend-config.yaml　を作り　kubectl apply -f backend-config.yaml

apiVersion: cloud.google.com/v1

kind: BackendConfig

metadata:

namespace: default

spec:

securityPolicy:

serviceのyamlに下記を追加

metadata:

annotations:

cloud.google.com/backend-config: '{"ports": {"8080":"hello-backend-config"}}'

↑これでは不足する

どこで設定状態を見るか？

ingress作成してLBとArmorつけて、デフォルトLBを削除してみる？

GKEの外部からのアクセスを制限するには？

　限定公開＋コントロールプレーンは承認済み等でアクセスしKubectlする

　ArmorでIP制限＋アダプティブ設定（ArmorはLBが要る）
GKEでNodePort TypeのServiceに対してインターネットアクセス許可する - IK.AM

限定公開クラスタ＋踏み台サーバにIAPで入りKubectl（承認済みNWでの制御はIPのみなので危ういらしい）
GKE(Google Kubernetes Engine) Autopilotの限定公開クラスタにIAPを利用してアクセスする | Tech-Tech (nddhq.co.jp)
【GKE/Terraform】外部ネットワークからの全てのアクセスを制限した限定公開クラスタを作成し、踏み台サーバーからkubectlする (zenn.dev)
コントロールプレーンとPod間で自動FWされない場合もありFirewall要チェック

　Cloud shellのグローバルIPを取得しシェルを承認済みNWにできないか？＞OK

　curl http://ifconfig.me/

GKEでPythonをCron定期実行させたい

ArgoでDAGを実行させたい

　https://zenn.dev/ring_belle/articles/2c4bbe4365b544

ArgoでGKEのCICD（Argoは別ホストでGithubにアクセスし、GKEを操る）

　https://www.asobou.co.jp/blog/web/argo-cd

サービスアカウント
Workload Identity Federation for GKEの新しい設定方法を解説 - G-gen Tech Blog

１）ノードに紐付いたサービスアカウントKSAをそのまま使用する(裏でimpersonate）

gkeのサービスアカウントとIAMサービスアカウントの紐づけが不要になった
VPCサービスコントロールで管理したい場合impersonateのSAを指定できないためWIFが要る

２）サービスアカウントのキーを Kubernetes Secret として GKE クラスタに登録する

３）Workload Identity Federationをつかう

GCP の Workload Identity サービスについてのまとめ #GoogleCloud - Qiita
Githubとか外部のサービスから利用するためSAを連携させる
IAM＞Workload identity連携画面で設定が見れる

※KSAはノード単位で設定、Pod単位でGCPのリソースにアクセスできるように管理したい？

●メモ
忙しいときはスケールアウトするが、落ち着き始めるとスケールinし、必要なPodも落とされてしまう

safe-to-evict　をymlのannotationで明示して特定Podはスケールinしない等にしておく

annotations:

cluster-autoscaler.kubernetes.io/safe-to-evict:"false"

クラスタのオートスケーラーイベントの表示 | Google Kubernetes Engine (GKE) | Google Cloud
↓
最小Pod数をスケールinした値で固定する等も

■Workloads リソース

Pod：Workloadsリソースの最小単位

ReplicaSet：Podのレプリカを作成し、指定した数のPodを維持し続けるリソースです。

Deployment：ローリングアップデートやロールバックなどを実現するリソースです。

DaemonSet(ReplicaSet亜種)：各ノードにPodを一つずつ配置するリソースです。

StatefulSet(ReplicaSet亜種)：ステートフルなPodを作成できるリソースです。

Job：Podを利用して、指定回数のみ処理を実行させるリソースです。(使い捨てPod)

CronJob：Jobを管理するリソースです。

Config connector：GKEでGCPリソースを調節してくれるアドオン。Podの増加減少にあたり必要なアカウントや権限やPubSub等々を自動作成や管理する。マニフェストのymlにcnrmのAPIを記載したりする（Config connector resource nameの略）

Config Connectorを試してみる (zenn.dev)

■GKE関連の運用

GKEクラスタ認証ローテーション

30日以内になると自動ローテーションするが危険なので手動が由

GKEはマイクロサービスのエンドポイントでのサービス提供かgcloud api利用が前提といえるのでこれでOK

1) ローテ開始 (CPのIPとクレデンシャル)

2) ノード再作成

3) APIクライアントを更新 (クレデンシャル再取得)

4) ローテ完了 (元IPと旧クレデンシャルの停止)

クラスタ認証情報をローテーションする | Google Kubernetes Engine (GKE) | Google Cloud

GKEクラスタ認証ローテーションの考慮

Google Kubernetes Engine のクラスタ認証情報をローテーションするまでに考えたこと - DMM inside

セキュアなGKEクラスタ

それなりにセキュアなGKEクラスタを構築する #GoogleCloud - Qiita

コントロールプレーンの自動アップグレード＆IPローテーション＆ノードブールの自動アップグレードで死ぬ

GKEシングルクラスタ構成で障害発生してサービス停止しちゃったのでマルチクラスタ構成にした話 (zenn.dev)

　CPの更新後はクレデンを取得しなおす必要がある、ArgoでCICDを組んでいるとクラスタに認証入りなおす必要がある
　ノードが入れ替わりに時間が掛かり、時間差で問題がでることがあるので注意

Posted by funa : 09:59 PM | Web | Comment (0) | Trackback (0)

October 31, 2023

GCP Network Connectivity

●共有 VPC
　同組織のプロジェクトのホストプロジェクト(親)のVPCをサービスプロジェクト(子)に共有

●VPC ネットワークピアリング
　異なる組織間の接続（双方のVPCでコネクションを作成する、内部IPで通信する、サブネットは重複しないこと、2ホップ制限で1:1＝3つ以上の場合は古メッシュでコネクション作成要）、k8sサービスとPod ipをVPCピアリング経由する利用法もある

●ハイブリッドサブネット

　Cloud VPN/Interconnect等が必要、オンプレルータとCloud RouterをBGPでつなぐ、オンプレとGCPをつなぐ

●Cloud Interconnect
　DCと専用線で閉域網接続、Cloud VPNより低レイテンシ/帯域安定

●Cloud VPN

　オンプレとIPsec VPN接続、アドレス帯の重複だめ、Cloud VPN側でBGPIP設定やIKEキー生成をしオンプレルータ側でそれらを設定する

●内部範囲
　VPCで使うIPをCIDRで定義しIP範囲の使用方法を事前に決定しておく、IPが勝手に使われたりしない等ができる

●限定公開の Google アクセス（Private Google Access）
　外部IPを持たないGCE等はデフォルトのインターネットゲートウェイ0.0.0.0を経由してGoogle APIにアクセスする、VPC＞Routesで見れる
●オンプレミスホスト用の限定公開の Google アクセス

　CloudVPNやInterconnectを経由してオンプレから内部IPを利用してGoogleAPIにアクセス、GCP側ではCloudDNSで特定のドメインのAレコードを入れる、選択したドメインのIPアドレス範囲を静的カスタムルートでVPC内のプライベートIPからルーティングできるように設定する、オンプレにはCloudRouterからドメインのIPアドレス範囲をBGPでルーティング広報する、VPNやInterconnectがないと0.0.0.0でGoogleAPIにアクセスするがこれだとRFC1918に準拠しない199.33.153.4/30などのIPを使う必要がありルーティングが複雑化したり、オンプレを通る場合があり通信は慎重に設計をすること

●Private Service Connect

　「限定公開の Google アクセス」の発展版、オンプレをNATでVPCに接続、内部IPでGoogleAPIにアクセスできる、PSCエンドポイントを介して内部IPで公開できる、NATされ内部IPの公開先での重複OK

●プライベートサービスアクセス
　VPCペアリングを併用してサービスプロデューサをVPCに接続し内部IPで次のようなサービスに内部IPでアクセスできるようにする（Cloud VPNまたはInterconnectを付け足せばオンプレからも可）、Cloud SQL/AlloyDB for posgre/Memorystore for Redis/Memcached/Cloud build/Apigee等の限られたもの

●サーバーレス VPC アクセス
　サーバレスからVPC内リソースにアクセスするためのコネクタ（通常は外部IP通信になるがコレだと内部IPでVPCにルーティングされる、/28のサブネットを指定）、例えば既存のcloud runサービスを編集しても付けられず初期構築時のみ設定できる

●外部 IP アドレスを持つ VM から API にアクセスする
IPv6をVMに設定し限定公開DNSゾーン設定をすればトラフィックはGCP内にとどまりインターネットを通りません

●CDN Interconnect
　Cloud CDNもあるが他社のCDNに接続する、Akamai/Cloud flare/fastly等々

●Network Connectivity Center
　ハブとなりCloudVPN/InterconnectをメッシュしGCP/オンプレ含め通信させる、Googleのバックボーンでユーザ企業の拠点間を接続できる

●ダイレクトピアリング
　GoogleのエッジNWに直接ピアリング接続を確立し高スループット化、Google workspaceやGoogleAPI用だが普通は使わずInterconnectを使う

●キャリアピアリング
　ダイレクトピアリングの高度な運用が自社対応できない等でサービスプロバイダ経由でGoogle workspaceなどのGoogleアプリに品質よくアクセスする

Google CloudのVPCを徹底解説！(応用編) - G-gen Tech Blog

●トンネル系の下記は色々権限が要りそうで候補
Compute OS login/IAP-secured tunnel user/Service account user/viewer/compute.instance*

■ポートフォワードは止めないと別につないで繋いでいるつもりでも同じところに繋ぎ続ける
lsof -i 3128
ps ax | grep 3128
ps ax | ssh

kill [PID]

■IAPトンネル

export http_proxy=http://localhost:3128

export https_proxy=http://localhost:3128

gcloud compute start-iap-tunnel --zone asia-northeast1-a gce-proxy001 3128 --local-host-port=localhost:3128 --project=gcp-proxy-prj

でコマンドを打てばIAP踏み台トンネルを通って外部に通信できる

■踏み台コマンド

gcloud compute ssh --projet gcp-prj-unco --zone asia-northeast1-a gce-step-svr

でSSHログインしそこからcurl等で操作する

■シークレットからPWを取りつつコマンドを打つ

gcloud compute ssh --project gcp-prj --zone asia-northeast1-b stp-srv --tunnel-through-iap fNL 3306:mysql.com: 3306

mysql -u baka_usr -p"$(gcloud secrets versions access latest --secret mysql_pw --project=gcp-prj)" -h 127.0.0.1-P 3306

　mysqlコマンドのpオプションは空白なしでPWを入れる、baka_usrはMySQLのユーザ、mysql_pwはsecret mgrに保存した名前
　$()のLinuxコマンドでgcloudコマンドを入れ子。ワンライナーの形で利用ができる

secret mgrのコマンド

　シークレットバージョンにアクセス | Secret Manager Documentation | Google Cloud

ワンライナー解説（変数と$()とバッククォート

　/// BANGBOO BLOG /// - Linux cmd

■SSHトンネル

sshの基本はこれ、セキュアシェル、トンネルは特殊？

SSH [オプション] [ログイン名@]接続先 [接続先で実行するcmd]
接続先に権限があること

SSHの疎通確認

ssh baka@stp_srv.unco.com

設定例

.ssh/config

User baka

Hostname step_srv

ProxyCommand ssh -W %h:%p baka@step_srv.unco.com

PubkeyAuthentication no

PasswordAuthentication yes

※sshはPWは危険なので鍵認証のみにしたい

　IPアドレス元を制限や同一IPのログイン試行は拒否する仕組み等は欲しい

SSHコネクション上でトンネル作る

ssh step_srv -L 8080:dest.benki.com:80

　とか ssh -L 8080:dest.benki.com:80 ahouser@step_srv.unco.com

※ポート22でstep_srvにSSHコネクションを貼り、ローカル:8080のリクエストはdest:80に転送する

↓

ブラウザか新規ターミナルでcurl

http://localhost:8080

ダメなら転送設定したターミナルはstep_srvにいるのでcurl

GCP、AWS、Azure 別に見るクラウド VM への攻撃経路まとめ (paloaltonetworks.jp)

＝＝＝＝＝＝＝＝＝＝＝＝＝
なぜレッドオーシャン化する前にサービスをグロースできなかったのか？ - フリマアプリ編 - (フリル)

サービスを急拡大させる意思決定が遅く競合に遅れ

競合出現後も経営方針を大きく変えなかった

勝利条件はユーザ数で機能差ではなかった

パワープレーでいかにプロモーションばら撒いて認知広げて第一想起をとるかだった

先行者優位で過ごせる期間は短い

スタープレイヤーの採用、手数料無料化、TVCM等PLを超えた手法があった、BS経営すべきだった

成長のキャップが創業者の能力になっていた

有能な人材：耳の痛いことを言ってくれる人材を経営チームに採用しても良かった

CTOが開発をし、組織運営の雑務をし、採用もやっていた

CEOは机の組み立てをするな。CTOはPCの購入をするな

役割の変化に素早く適用し権限移譲を行い、やるべきことをやれる状況を作る

あるいは必要な組織を大きくすることに注力する、例えば開発組織を大きくする

戦時のCEO、皆に戦時であることを伝える、企業文化に背く意思決定も行う

研究や教育等、やった方が良さそうな耳障りの良いタスクも拒否する

どうやったら市場で勝てるかの戦略

↓
IPOとか目指さなければConfort zoneを見つけてじっくりまったりビジネスを継続させる手もある
メルカリやPay2をみた結果論、このやり方も古いというかアレ

視力回復の音
(16) HOKKORI 📽💫🐈🐢 on X: "視力回復してください❤️‍🩹😹 https://t.co/Zug4pEbvys" / X (twitter.com)

Posted by funa : 10:57 PM | Web | Comment (0) | Trackback (0)

June 21, 2023

Machine learning(Bigquery ML)

機械学習：

　マシーンラーニング、ML。マッシーンがLearnしデータの背景にあるルールやパターンを発見する。

モデル：

　機械学習における入力データに対して結果(出力)を導き出す仕組み。モデルは入力されたデータを解析し、評価/判定を行った結果を出力として返す。つまり、機械学習は「入カ＞モデル＞出力」から成る。

学習データ

　モデルをつくるために学習させるデータ

適用データ

　モデルに対して予測を適用させるデータ

教師あり

　学習データに対して正解ラベルを付けて学習する方法

　　例)過去にDMを送付した結果(目的変数)を用いて学習させる

教師ありは、回帰と分類の2つに分けられます。

　回帰(予测)

　　連続する数値を予測するもので、売上、重量、温度などを算出する

　分類(識別)

　　データがどのクラスに属するかを予測するもので、販売商品が売れる見込み/売れない見込みなどに分類

　　DMにおいては分類モデル(買う・買わないの識別)を使用

目的変数

　結果側の変数

　例)ある特定のカテゴリやブランドをその顧客が注文する

　　●確率(購入する・しない)

　　　ー学習データにターゲットフラグ (購入あり=1、購入無し=0)を立てる

　　　ー適用後に出てくる結果は0～1 (0%～100%) の範囲

　　●金額

説明変数(特微量とも呼ぶ)

　原因側のデータ

　目的変数を予測するために使用する顧客の様々な情報、大きく分けて2種類

　　●顧客属性

　　　ー法人/個人事業主など事業形態、登録住所の郵便番号、業種コードなど

　　●購買履歴

　　　ー購買いつ、何を、どのくらい購入したか等の情報

　　　ー各商品カテゴリ毎の購入金額 etc.

質的変数

　数値で推し測ることができ、数字の大小に意味をもつデータ

　　(例)売上、購入回数、従業員数、DM送付回数

單的変数

　単に分類や種類を区別するためだけのデータ

　　(例)都道府県、茎種コード、購入有無

統計手法

　重回帰分析:

　　説明変数xが目的変数yの値を変化させます。そのため、説明変数から、目的変数の値を予測可能です。

　ロジスティック回帰

　　yが1になる確率を判別します。いくつかの要因(説明変数)から「2値の結果(目的変数)」が起こる確率を説明・予測

　　　2値の結果とは合格/不合格、採用/不採用など、答えが2つしかない場合を指し

線形回帰（エクセル）
　slope関数：回帰直線の傾きを取得
　inercept関数：回帰直線の切片を取得
　forecast関数：単回帰分析からの推測値を取得
+++++++++++++

BigQueryを利用して機械学習を簡易に学びたいです。Webアプリのログよりサーバーエラーを予測するようなもので方法を教えてください　> BigQueryを利用して機械学習を学び、Webアプリのログからサーバーエラーを予測する方法について簡単に解説します。以下はその手順の概要です。

●ステップ1: データの準備

まず、WebアプリのログデータをBigQueryにインポートします。ログデータには、タイムスタンプ、リクエストの詳細、ステータスコード、エラーメッセージなどの情報が含まれているはずです。

例:ログデータスキーマ server_log

timestamp: TIMESTAMP

request_id: STRING

status_code: INTEGER

error_message: STRING

user_agent: STRING

response_time: FLOAT

●ステップ2:データの前処理

エラーログの解析を容易にするために、データをクリーンアップし、特徴量を作成します。

CREATE OR REPLACE TABLE ds.cleaned_log AS

SELECT

timestamp,

status_code,

error_message,

user_agent,

response_time,

IF(status_code >= 500, 1, 0) AS is_error

FROM

ds.server_log

WHERE

timestamp BETWEEN 2023-01-01 AND 2023-12-31;

このクエリでは、ステータスコードが500以上のものをエラーと見なし、is_error列を追加しています。

●ステップ3:特徴量エンジニアリング

機械学習モデルに投入するための特徴量を作成します。例えば、以下のような特徴量を考えます。

-時間帯 (hour)

-ユーザーエージェント (user_agent)

-過去のエラーレート(past_error_rate)

※past_error_rateを省くとどうなのか?

CREATE OR REPLACE TABLE ds.features AS

SELECT

EXTRACT(HOUR FROM timestamp) AS hour,

user_agent,

response_time,

is_error,

--AVG(is_error) OVER (PARTITION BY user_agent ORDER BY timestamp RANGE BETWEEN INTERVAL 1 DAY PRECEDING AND CURRENT ROW) AS past_error_rate

AVG(is_error) OVER (PARTITION BY user_agent) AS past_error_rate

FROM

ds.cleaned_log;

●ステップ4: 機械学習モデルの作成

BigQuery MLを使用してモデルを作成します。ここではロジスティック回帰モデルを使用してエラーの予測を行います。
他には、The CREATE MODEL statement | BigQuery | Google Cloud

MODEL_TYPE = { 'LINEAR_REG' |'LOGISTIC_REG' |'KMEANS' |'MATRIX_FACTORIZATION' |'PCA' |'AUTOENCODER' |'AUTOML_CLASSIFIER' |'AUTOML_REGRESSOR' |'BOOSTED_TREE_CLASSIFIER' |'BOOSTED_TREE_REGRESSOR' |'RANDOM_FOREST_CLASSIFIER' |'RANDOM_FOREST_REGRESSOR' |'DNN_CLASSIFIER' |'DNN_REGRESSOR' |'DNN_LINEAR_COMBINED_CLASSIFIER' | 'DNN_LINEAR_COMBINED_REGRESSOR' |'ARIMA_PLUS' |'ARIMA_PLUS_XREG' |'TENSORFLOW' |'TENSORFLOW_LITE' |'ONNX' |'XGBOOST'}

CREATE OR REPLACE MODEL ds.error_prediction_model

OPTIONS(model_type='logistic_reg', input_label_cols=['is error'] AS

SELECT

hour,

user_agent,

response_time,

past_error_rate,

is_error

FROM

ds.features;

●ステップ5: モデルの評価

モデルを評価し、精度を確認します。

SELECT

FROM

ML.EVALUATE(MODEL, `ds.error.prediction_model`,(

SELECT hour,

user_agent,

response_time,

past_error_rate,

is_error

FROM

ds.features

));

●ステップ6: エラーの予測

新しいデータを使ってエラーを予測します。

SELECT

predicted_is_error,

predicted_is_error_probs

FROM

ML.PREDICT(MODEL `ds.error_prediction_model`,(

SELECT

EXTRACT(HOUR FROM timestamp) AS hour,

user_agent,

response_time,

--AVG(CASE WHEN status_code 500 THEN 1 ELSE 0 END) OVER (PARTITION BY user_agent ORDER BY timestamp RANGE BETWEEN INTERVAL 1 DAY PRECEDING AND CURRENT ROW) AS past_error_rate

AVG(CASE WHEN status_code >= 500 THEN 1 ELSE 0 END) OVER (PARTITION BY user_agent) AS past_error_rate

FROM

ds.new_server_log

));

●ダミーデータ

INSERT INTO ds.server_log (timestamp, request_id, status_code, error_message, user_agent, response_time)

VALUES

('2024-06-28 18:00:00 UTC', 'req 801, 208, '', 'Mozilla/5.0 (Windows NT 18.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36', 0.123),

(2024-06-20 10:01:00 UTC', 'req 002, 588, Internal Server Error', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36', 8.456),

(2024-06-28 10:02:00 UTC', 'req 003', 484, 'Not Found', 'Mozilla/5.0 (iPhone; CPU iPhone OS 14,6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.1 Mobile/15E148 Safari/604.1, 8.234),

(2024-06-20 10:03:00 UTC', 'req 004', 200, '', 'Mozilla/5.0 (Windows NT 18.8; Win64; x64; rv:89.0) Gecko/20100181 Firefox/89.8, 0.345),

(2024-06-28 10:04:00 UTC, 'req 005', 502, Bad Gateway', 'Mozilla/5.0 (Linux; Android 11; SM-G9918) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.8.4472.124 Mobile Safari/537.36, 0.678),

(2024-86-28 10:05:00 UTC, 'req 006', 503, 'Service Unavailable', 'Mozilla/5.0 (iPad; CPU OS 14.6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.1 Mobile/15E148 Safari/6084.1, 0.789), (2824-86-28 18:06:00 UTC, req 007, 200, Chrome/91.0.4472.124 Safari/537.36, 0.567), Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko)

(2024-06-2010:07:00 UTC, 'req 008, 500, Internal Server Error', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.8.4472.124 Safari/537.361, 0.890),

(2024-06-20 18:08:00 UTC, req 009, 404, Not Found', 'Mozilla/5.0 (iPhone; CPU iPhone OS 14 6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.1 Mobile/15E148 Safari/604.11', 8.345),

('2024-06-28 18:09:00 UTC', 'req 010', 200, '', 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0 Gecko/20100101 Firefox/89.0', 0.456);

INSERT INTO ds.new_server_log (timestamp, request_id, status_code, error_message, user_agent, response_time)

VALUES

(2024-06-21 09:00:00 UTC', 'req 101', 200, '', 'Mozilla/5.0 (Windows NT 18.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36', 0.112),

(2024-06-21 09:01:08 UTC, req 102', 500, Internal Server Error', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.8.4472.124 Safari/537.36, 0.478),

(2024-06-21 09:02:00 UTC', 'req 183, 484, 'Not Found', 'Mozilla/5.0 (iPhone; CPU iPhone OS 14_6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.1 Mobile/15E148 Safar1/684.1, 0.239),

(2024-06-21 09:03:00 UTC', 'req 104, 200, Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:89.0) Gecko/20100101 Firefox/89.0, 8.301),
(2024-06-21 09:04:08 UTC, req 185', 502, 'Bad Gateway', 'Mozilla/5.0 (Linux; Android 11; SM-G9918) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.8.4472.124 Mobile Safari/537.36', 8.683),

(2024-06-21 09:05:00 UTC, req 106', 503, Service Unavailable', 'Mozilla/5.0 (iPad; CPU OS 14,6 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.1.1 Mobile/15E148 Safari/604.1, 0.756),
(2024-06-21 09:06:00 UTC, req 107, 208, ", Mozilla/5.0 (Windows NT 18.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.8.4472.124 Safari/537.36, 0.523),
(2024-06-21 09:07:00 UTC, req 188, 500, Internal Server Error, Mozilla/5.0 (Macintosh; Intel Mac OS X 10.15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.8.4472.124 Safari/537.36, 0.812),

('2024-06-21 09:08:08 UTC', 'req 109,, 404, 'Not Found', 'Mozilla/5.0 (iPhone: CPU iPhone OS 14,6 1ike Mac OS X) AppleWebKit/685.1.15 (KHTML, like Gecko) Version/14.1.1 Mobile/15E148 Safari/604.1', 0.267),

('2024-06-21 09:09:08 UTC', 'req 110', 200, '', 'Mozilla/5.0 (Windows NT 18.8; Win64: x64; rv:89.0) Gecko/20180101 Firefox/89.8', 8.412);

Posted by funa : 08:00 PM | Web | Comment (0) | Trackback (0)

Navi: 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 >

For mobile click here
For smart phone click here

#1	Web
#2	Hiace 200
#3	Gadget
#4	The beginning of CSSレイアウト
#5	Column
#6	Web font test
#7	Ora Ora Ora Ora Ora
#8	Wifi cam
#9	みたらし団子
#10	Arcade Controller
#11	G Suite
#12	PC SPEC 2012.8
#13	Javascript
#14	REMIX DTM DAW - Acid
#15	RSS Radio
#16	Optimost
#17	通話SIM
#18	Attachment
#19	Summer time blues
#20	Enigma
#21	Git
#22	Warning!! Page Expired.
#23	Speaker
#24	Darwinian Theory Of Evolution
#25	AV首相
#26	htaccess mod_rewite
#27	/// BANGBOO BLOG /// From 2016-01-01 To 2016-01-31
#28	竹書房
#29	F☆ck CSS
#30	Automobile Inspection
#31	No ID
#32	Win7 / Win10 Insco
#33	Speaker
#34	Arcade Controller
#35	Agile
#36	G Suite
#37	Personal Information Privacy Act
#38	Europe
#39	Warning!! Page Expired.
#40	GoogleMap Moblile
#41	CSS Selectors
#42	MySQL　DB　Database
#43	Ant
#44	☆od damnit
#45	Teeth Teeth
#46	Itinerary with a eurail pass
#47	PHP Developer
#48	Affiliate
#49	/// BANGBOO BLOG /// From 2019-01-01 To 2019-01-31
#50	/// BANGBOO BLOG /// From 2019-09-01 To 2019-09-30
#51	/// BANGBOO BLOG /// On 2020-03-01
#52	/// BANGBOO BLOG /// On 2020-04-01
#53	Windows env tips
#54	恐慌からの脱出方法
#55	MARUTAI
#56	A Rainbow Between Clouds‏
#57	ER
#58	PDF in cellphone with microSD
#59	DJ
#60	ICOCA
#61	Departures
#62	Update your home page
#63	CSS Grid
#64	恐慌からの脱出方法
#65	ハチロクカフェ
#66	/// BANGBOO BLOG /// On 2016-03-31
#67	/// BANGBOO BLOG /// From 2017-02-01 To 2017-02-28
#68	/// BANGBOO BLOG /// From 2019-07-01 To 2019-07-31
#69	/// BANGBOO BLOG /// From 2019-10-01 To 2019-10-31
#70	/// BANGBOO BLOG /// On 2020-01-21
#71	Bike
#72	Where Hiphop lives!!
#73	The team that always wins
#74	Tora Tora Tora
#75	Blog Ping
#76	無料ストレージ
#77	jQuery - write less, do more.
#78	Adobe Premire6.0 (Guru R.I.P.)
#79	PC SPEC 2007.7
#80	Google Sitemap
#81	Information privacy & antispam law
#82	Wifi security camera with solar panel & small battery
#83	Hope get back to normal
#84	Vice versa
#85	ハイエースのメンテ
#86	Camoufla
#87	α7Ⅱ
#88	Jack up Hiace
#89	Fucking tire
#90	Big D
#91	4 Pole Plug
#92	5-year-old shit
#93	Emancipation Proclamation
#94	Windows env tips
#95	Meritocracy
#96	Focus zone
#97	Raspberry Pi
#98	Mind Control
#99	Interview
#100	Branding Excellent

Column [133]
Europe [9]
Gadget [77]
Web [136]
Bike [4]

現代思想 on Feb 04
Corporate Law, Accounting, General Affairs, and Labor on Jan 31
竹書房 p probability diddy on Jan 03
law enforcement on Jan 01
GitHub Actions on Dec 27

< April 2025 >
Sun	Mon	Tue	Wed	Thi	Fri	Sat
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30