Amplitudeユーザーは、AmplitudeイベントデータをSnowflakeアカウントにロードする機能を利用できます。Amplitude UIを介して、繰り返し同期を設定するだけでなく、履歴データの手動で開始することができます。
注意: この機能は、地域に関係なく、料金を支払ったすべてのお客様が利用できます。
Snowflakeに繰り返しデータのエクスポートを設定する
繰り返しデータエクスポートの作成は簡単で、3段階のプロセスで自分で処理できます。各同期は5~10分で完了しますが、多くの場合、リアルタイムに近い時間で完了できます。また、この方法により、ジョブを見ることができます。
Amplitudeデータの繰り返しエクスポートをSnowflakeに設定するには、次のステップに従ってください:
注意: Amplitudeの管理権と、Snowflakeのリソースを有効にする役割が必要になります。
- ソースとデスティネーション→デスティネーションに移動します。
- さらにデスティネーションを追加...の下で、Snowflakeパネルをクリックします。
データをSnowflakeにエクスポートページは、始めるタブ
に開きます。 - Snowflakeにデータをエクスポートするで、エクスポートするデータを選択します。
注意: これは、現在、今日と将来的に取り込まれるイベントに限定されます。
- イベントテーブルと[IDをマージ]テーブルのスキーマを確認し、[次へ]をクリックします。[エクスポートを設定]タブが開きます。
- AmplitudeのSnowflake Credentialsセクションで、次の情報を入力します:
- アカウント名: これは、Snowflakeアカウントのアカウント名です。これが'snowflakecomputing.com'の前の、Snowflake URLの最初の部分です。
- ウェアハウス: ウェアハウスAmplitudeは、データをロードするために使用されます。理想的には、Amplitudeのデータをロードする専用ウェアハウスとなるべきです; その場合、他の通常のSnowflakeの操作を妨げることはありません。
- データベース: データが保存されるデータベースです。同様に、このデータベースはAmplitudeデータに特化したものであるべきです。
- ユーザー名: ユーザー名 Amplitudeは、Snowflakeアカウントに接続するために使用されます。
- パスワード: パスワードは、ユーザー名と関連付けられています
注意: これらの資格情報は大文字と小文字を区別するので、注意してください。
- 資格情報セクションの横に、Amplitudeは、Snowflakeオブジェクトを作成するために使用するクエリを動的に作成します。クリップボードにコピーするには、[コピー]をクリックします。これで、Snowflakeアカウントに貼り付けできるようになりました。
- [次へ]をクリックしますAmplitudeは、入力した資格情報を使用して、テストデータをアップロードしようとします。アップロードが成功した場合は、終了をクリックします。
将来のすべてのイベントは、自動的にSnowflakeに送信されます。
ここから、Amplitudeは5分間隔でマイクロバッチファイルを生成し、10分ごとに顧客が所有するSnowflakeアカウントに直接ロードします。Amplitudeがイベントを受け取った後、20分以内に、Snowflakeアカウントでデータを閲覧することができます。
Amplitudeの履歴データをSnowflakeにエクスポートする
履歴データをAmplitudeからSnowflakeにエクスポートするには、データをエクスポートをクリックし、日付範囲を選択します。
このプロセスは、データ量、ウェアハウスサイズ、クラスター数、ネットワーク帯域幅、および現在持っている同時履歴データのエクスポートの数に応じて、1日から数週間までかかる可能性があります。
ベストプラクティス: Snowflake計算コストを削減する
Amplitudeからデータを受信する際に、Snowflake計算コストを削減したい場合は、次のメソッドを試してください:
注意: これらの推奨が有効かどうかは、Snowflakeインスタンスにエクスポートする頻度によって異なります。
- ウェアハウスサイズとクラスター数を変更します。短時間のエクスポートケイデンス(15~30分)は、xsmallまたはsmallで始めるようにしてください。その後、必要に応じてアップグレードします。
- Snowflakeにデータをバックフィルする場合は、小さなウェアハウスから初めて、必要に応じてアップグレードします。
- 自動一時停止時間を60秒に減らすこともできます。このオプションは、Snowflake UIで使用できない可能性がありますが、直接Snowflakeクエリを介して手動で設定することができます。
Snowflakeエクスポートフォーマット
イベントテーブルのスキーマには、次のものが含まれます:
列 |
説明 |
amplitude_id 番号(38、0) |
ユーザーの元のAmplitude ID。このフィールドを使用して、マージされたユーザーを自動的に処理します。
|
adid VARCHAR(16777216) |
(Android) Google Playサービス広告ID (AdID)。
|
amplitude_event_type |
Amplitudeが生成するイベントに基づくAmplitudeの特定の識別子。これはレガシーフィールドであるため、event_typeはすべてのクエリで十分でなければなりません。 |
amplitude_id |
独自のユーザーをカウントするために使用される内部ID。 |
アプリ |
プロジェクトの[設定]ページで見つかったプロジェクトID。 |
市 |
市。 "San Francisco" |
client_event_time |
デバイスがイベントをログしたときのローカルタイムスタンプ(UTC)。
|
client_upload_time |
デバイスがイベントをアップロードしたときのローカルタイムスタンプ(UTC)。 |
国 |
国。"米国" |
データ |
|
device_brand |
デバイスブランド。 |
device_carrier |
デバイスキャリア。 |
device_family |
デバイスファミリ。 |
device_id |
デバイス固有の識別子。 |
device_manufacturer |
デバイスメーカー。 |
device_model |
デバイスモデル。 |
device_type |
デバイスタイプ。 |
dma VARCHAR(16777216) |
指定マーケティングエリア(DMA)。 |
event_id 番号(38、0) |
イベントを区別するカウンタ。 |
event_time |
Amplitudeタイムスタンプ(UTC)は、server_received_timeとclient_upload_timeの違いによって調整されたclient_event_timeで、特に次のようなものです: event_time = client_event_time + (server_received_time - client_upload_time)
TWeは、このタイムスタンプを使用して、Amplitudeチャートでイベントを整理するために使用されます。 注意: |
event_type |
割り当てられたイベントのタイプ。 |
followed_an_identify |
この現在のSDKイベントと、前回のSDKイベントの間に識別イベントがあった場合は、真です。 |
グループ |
グループタイプ。詳細については、[アカウント]のドキュメントを参照してください。 |
idfa |
(iOS)広告主の管理番号。 |
ip_address |
IPアドレス。"123.11.111.11" |
location_lat |
緯度。 |
location_lng |
Longitude. |
os_name |
OS名。 |
os_version |
OSバージョン。 |
支払 |
ユーザーが収益を記録した場合は 注意: プロパティ値は、識別API経由で変更することができます。
|
地域 |
地域。 |
server_upload_time タイムスタンプ |
当社サーバーがイベントを受け取ったときのAmplitudeタイムスタンプ(UTC)。
|
session_id |
エポック以来ミリ秒でのセッション開始時間。 |
start_version |
ユーザーが最初に追跡されたアプリバージョン。 |
user_creation_time タイムスタンプ |
ユーザーの最初のイベントのEvent_time (UTC)。
|
user_id VARCHAR(16777216) |
あなたによって指定された読みやすいID。変更がないものでなければなりません; そのため、ユーザーの電子メールアドレスを使用することは推奨されません。 |
uuid |
行ごとの一意の識別子(送信済みイベント)。
|
version_name |
アプリバージョン. |
マージされたユーザーのテーブルスキーマには、次のものが含まれます:
列 |
説明 |
amplitude_id 番号(38、0) |
ユーザーの元のAmplitude IDにマージされているAmplitude ID。 |
merge_event_time タイムスタンプ |
ユーザーの新しいAmplitude IDが元のAmplitude IDと関連付けられたイベントの時間 |
merge_server_time タイムスタンプ |
ユーザーの新しいAmplitude IDが元のAmplitude IDと関連付けられたイベントのサーバー時間。 |
merged_amplitude_id 番号(38、0) |
ユーザーが最初に作成されたとき、最初に割り当てられたAmplitude ID。 |