Amazon BedrockでAlexaと音声チャットできるスキルを作成する

2026-01-20

Amazon BedrockでAlexaと音声チャットできるスキルを作成する

記事をシェアする

はじめに

業務でAWSのAI関連サービスを扱う機会が増えてきました。そこで、理解を深めることを目的に個人のAWSアカウントで実際に手を動かしてみることにしました。

今回は、Amazon Bedrockを使って、Alexaと会話できるスキルを作成します。

対象読者

AWSを使った生成AIサービスに興味がある方
Alexaスキルを自作してみたい方
音声UIとAIを組み合わせたアプリケーションを試したい方

前提条件

AWSアカウントを保有していること
LambdaやIAMの基本操作に慣れていること（初心者でも手順通りで実装可能）

Alexaスキルとは

Alexaスキルは、Amazon Echoなどのスマートスピーカーに追加できる機能（アプリ）のことです。Amazonが公式で提供しているスキルの他に、開発者が自作したスキルを使うこともできます。

スキルには大きく分けて2種類あります。

公開スキル: スキルストアで誰でも利用できるスキル（審査あり）
開発中スキル: 開発者のみ利用できるスキル（審査なし）

今回は個人用のスキルを作るため、開発中スキルとして作成します。

今回作るもの

「Claudeトーク」という名前のAlexaスキルを作成します。

Echoデバイスに「アレクサ、クロードトークを開いて」と呼びかけるとスキルが起動
自由に話しかけるとAIが応答を生成して音声で返答
会話履歴を保持し、文脈を踏まえた応答が可能
月間コストの上限を設定し、超過時は起動をブロック

スキルの使い方

呼びかけ	動作
「アレクサ、クロードトークを開いて」	スキル起動
「AWSとは何ですか」など自由に話しかける	AIが応答
「ストップ」「終了」	スキル終了

スキル起動後は何を話しかけてもAIが応答します。会話は続けて行え、文脈を覚えています。

会話の終了について: 「ストップ」「終了」と言うか、一定時間（約8秒）無言でいるとスキルが終了します。スキルが終了すると会話履歴はリセットされ、次回起動時は新しい会話として始まります。

構成図

使用するAWSサービス

サービス	概要
Amazon Bedrock	各社の生成AIモデルをAPI経由で利用できるサービス。今回はAnthropicのClaudeを使用
AWS Lambda	サーバーレスでプログラムを実行できるサービス。Alexaからのリクエストを処理
Amazon CloudWatch	AWSリソースの状態やログを収集するサービス。トークン使用量の取得に使用
IAM	AWSリソースへのアクセス権限を管理するサービス

モデル選定

今回はClaude Sonnet 4.5を使用します。

コストと性能のバランスが良く、会話用途には十分な性能があります。業務でもBedrockのClaudeを使用しており、使い慣れているモデルということも選定理由の一つです。

JP Cross-Region Inference（日本国内クロスリージョン推論）

Amazon BedrockではJP Cross-Region Inference（日本国内クロスリージョン推論）を利用できます。

JP Cross-Region Inferenceとは

推論リクエストが東京（ap-northeast-1）と大阪（ap-northeast-3）リージョン間で自動的にルーティングされる機能です。一方のリージョンが混雑している場合、もう一方に振り分けられることで、安定した応答が期待できます。

なぜJP Cross-Region Inferenceを使うのか

Claude Sonnet 4.5 / Haiku 4.5は、日本では推論プロファイル（jp.*）経由でのみ利用可能です。東京リージョン単体での直接呼び出し（anthropic.claude-sonnet-4-5-*）はサポートされていません。そのため、これらのモデルを日本で使う場合は必然的にJP Cross-Region Inferenceを使用することになります。

グローバル推論プロファイルを使わない理由

Bedrockには、世界中のリージョンにルーティングできるグローバル推論プロファイルもあります。しかし今回は以下の理由でJP Cross-Region Inferenceを選択しました。

レイテンシー: 日本国内で処理が完結するため、海外リージョンへの通信が不要で応答が速い
データの所在地: 推論リクエストが日本国外に送信されない

特に企業でAWSを使う場合、コンプライアンスやデータ主権の観点から「データを国内に保管する」要件があるケースも多いようです。JP Cross-Region Inferenceは、このような要件を満たしつつ高可用性を実現できます。

参考: AWSブログ「Introducing Amazon Bedrock cross-Region inference for Claude Sonnet 4.5 and Haiku 4.5 in Japan and Australia ⧉」

今回はモデルIDにjp.anthropic.claude-sonnet-4-5-20250929-v1:0を指定します。

コストと応答時間

コスト: 1回の会話あたり約0.5〜1円程度。100回会話しても$0.50（約75円）程度で収まります。※AWS Lambdaは月100万リクエストまで無料枠があるため、個人利用では実質Bedrock料金のみです。

※ 会話が長くなると履歴を含めてAPIに送信するため、トークン消費量が増加します。短い会話を多数行う場合の目安です。

応答時間: 質問から回答まで5〜7秒程度。主にBedrockの推論処理に時間がかかります。精度より速度を重視する場合は、Claude Haiku 4.5を使用したり、システムプロンプトで回答文字数を制限（例：「50文字以内で回答」）すると改善できます。

事前準備：Bedrockモデルの有効化

Lambda関数を作成する前に、BedrockでClaudeモデルを有効化しておきます。

モデルの有効化手順

2024年後半以降、Bedrockの「モデルアクセス」ページが廃止され、モデル有効化の手順が変更されました。現在は以下の手順で有効化します。

AWSマネジメントコンソールでAmazon Bedrockを開く
左のナビゲーションペインから「プレイグラウンド」→「チャット/テキストのプレイグラウンド」を選択
「モデルを選択」ボタンをクリック
カテゴリ「Anthropic」、モデル「Claude Sonnet 4.5」、推論「JP Anthropic Claude Sonnet 4.5」を選択し、「適用」をクリック
ユースケースの入力画面が表示されるので、利用目的を入力して提出
承認後、プレイグラウンドで1回以上チャットを実行する（何か質問を送信）

個人利用の場合のユースケース入力について: Claudeモデルを使用する際は会社名などの入力が求められますが、個人でも利用可能です。個人利用の場合は、会社名に「個人」「無所属」または個人名を入力し、ユースケースには「個人学習」「技術検証」などと記載すれば使用できます。

AWS Marketplaceサブスクリプションについて

Bedrockの一部モデル（Claudeを含む）はAWS Marketplace経由で提供されており、初回利用時にサブスクリプションが自動作成されます。プレイグラウンドでチャットを実行すると、このサブスクリプション処理が完了します。

プレイグラウンドを使わずにLambdaから直接モデルを呼び出す場合は、IAMロールに以下のAWS Marketplace権限を追加する必要があります。

1
{
2
    "Effect": "Allow",
3
    "Action": [
4
        "aws-marketplace:Subscribe",
5
        "aws-marketplace:ViewSubscriptions"
6
    ],
7
    "Resource": "*"
8
}

補足: プレイグラウンドで一度チャットを実行しておけば、サブスクリプションが完了するため上記の権限は不要です。簡単に済ませたい場合はプレイグラウンドでの動作確認をおすすめします。

補足: プレイグラウンドを使わずにユースケースを提出する場合は、PutUseCaseForModelAccess APIを使用する方法もあります。

Service Quotasの確認

AlexaスキルでBedrockを頻繁に呼び出す場合、デフォルトのクォータでは制限に達する可能性があります。事前に確認・緩和申請を行うことで、運用中のエラーを防げます。

BedrockのService Quotasで、モデルの呼び出し回数やトークン数の上限を確認できます。

Service Quotas

注意: 新規アカウントや利用実績の少ないアカウントでは、デフォルトで低いクォータが設定されていることがあります。（例：1分間に1回のみ呼び出し可能など）

上限緩和の申請方法は以下の通りです。

Service Quotasコンソールから: 「アカウントレベルでの引き上げをリクエスト」ボタンをクリック
AWSサポートから: 「アカウントレベルでの引き上げをリクエスト」ボタンがない場合はサポートケースを作成して申請（「アカウントと請求」を選択し、サービスは「Service Quotas」を選択）

上限緩和申請

実装手順

1. Lambda関数の作成

AWSコンソールからLambda関数を作成します。

Lambda関数の作成

項目	値
関数名	alexa-ai-chat
ランタイム	Python 3.14
アーキテクチャ	x86_64
実行ロール	基本的なLambdaアクセス権限で新しいロールを作成

Lambda関数の作成（続き）

2. Lambda関数の基本設定

Bedrockの呼び出しには数秒かかるため、タイムアウトを30秒に変更します。

Lambda基本設定

項目	値
メモリ	256 MB
タイムアウト	30秒

3. IAMポリシーの追加

Lambda関数の実行ロールには、デフォルトでCloudWatch Logsへの書き込み権限が付与されています。これに加えて、BedrockとCloudWatchメトリクスの権限を追加します。

IAMロールの確認

IAMポリシーの編集

Bedrock呼び出し権限

JP Cross-Region Inferenceを使用するため、推論プロファイルと東京・大阪両リージョンの基盤モデルへのアクセス権限が必要です。

1
{
2
    "Sid": "BedrockCrossRegionInference",
3
    "Effect": "Allow",
4
    "Action": [
5
        "bedrock:InvokeModel",
6
        "bedrock:InvokeModelWithResponseStream"
7
    ],
8
    "Resource": [
9
        "arn:aws:bedrock:ap-northeast-1:*:inference-profile/jp.anthropic.*",
10
        "arn:aws:bedrock:ap-northeast-1::foundation-model/anthropic.*",
11
        "arn:aws:bedrock:ap-northeast-3::foundation-model/anthropic.*"
12
    ]
13
}

CloudWatchメトリクス取得権限（コスト管理用）

1
{
2
    "Effect": "Allow",
3
    "Action": [
4
        "cloudwatch:GetMetricData"
5
    ],
6
    "Resource": "*"
7
}

4. Lambda関数のコード

主な機能は以下の通りです。

会話履歴の保持: 同一セッション内で直近30往復まで保持し、文脈を踏まえた応答が可能（スキル終了で履歴はリセット）
JP Cross-Region Inference対応: 日本国内リージョンで推論を実行
コストチェック: スキル起動時に月間コストをチェックし、上限超過時はブロック

処理フロー

Alexaスキルでは、ユーザーの操作に応じて異なる種類のリクエストがLambdaに送信されます。

リクエスト種別	発生タイミング
LaunchRequest	スキル起動時（「〇〇を開いて」と呼びかけた時）
IntentRequest	スキル起動後にユーザーが発話した時
SessionEndedRequest	セッション終了時（タイムアウトなど）

IntentRequestには「何をしたいか」の情報が含まれており、発話内容に応じてConversationIntent（ユーザーの自由な発話を受け取るカスタムインテント）やAMAZON.StopIntent（スキル終了）などのインテントに振り分けられます。

flowchart TD
    A[Alexaからリクエスト] --> B{リクエスト種別}
    B -->|LaunchRequest| C[コストチェック]
    C --> D{上限超過?}
    D -->|Yes| E[利用停止メッセージ]
    D -->|No| F[起動メッセージ]
    B -->|ConversationIntent| G[ユーザー発話取得]
    G --> H[会話履歴に追加]
    H --> I[Bedrock呼び出し]
    I --> J[AI応答を履歴に追加]
    J --> K[音声で応答]
    B -->|StopIntent| L[終了メッセージ]
    B -->|HelpIntent| M[ヘルプメッセージ]
    B -->|FallbackIntent| N[再発話を促すメッセージ]

Lambda関数コード

1
# lambda_function.py
2
# Alexa × AWS Bedrock Claudeトーク
3

4
import json
5
import boto3
6
import logging
7
import time
8
from datetime import datetime
9

10
# ログ設定
11
logger = logging.getLogger()
12
logger.setLevel(logging.INFO)
13

14
# Bedrock クライアント
15
bedrock = boto3.client('bedrock-runtime', region_name='ap-northeast-1')
16

17
# CloudWatch クライアント（コストチェック用）
18
cloudwatch = boto3.client('cloudwatch')
19

20
# モデル設定
21
MODEL_ID = "jp.anthropic.claude-sonnet-4-5-20250929-v1:0"
22

23
# コスト設定
24
# 月間利用上限（USD）- この金額に達するとスキルを一時停止
25
COST_LIMIT_USD = 5.00
26

27
# AWS Bedrock JP Regional 料金（1トークンあたりの単価）
28
INPUT_TOKEN_PRICE = 0.0033 / 1000   # $0.0033 / 1K tokens
29
OUTPUT_TOKEN_PRICE = 0.0165 / 1000  # $0.0165 / 1K tokens
30

31
# システムプロンプト
32
SYSTEM_PROMPT = """あなたはAlexaの音声アシスタントです。
33

34
【回答の長さルール】
35
- 雑談・挨拶: 1-2文（50文字程度）
36
- 質問への回答: 3-5文（150文字程度）
37
- 説明・解説を求められた場合: 5-10文（300文字程度）
38
- 「詳しく」「もっと教えて」と言われたら: 長めに回答
39

40
【基本ルール】
41
- 音声で聞きやすいよう、箇条書きは避ける
42
- 「〜ですね」「〜ですよ」など話し言葉で
43
- 長くなりそうなら「続きを聞きますか？」と確認
44
"""
45

46
def lambda_handler(event, context):
47
    """Lambda メインハンドラー"""
48
    logger.info(f"Received event: {json.dumps(event, ensure_ascii=False)}")
49

50
    request_type = event['request']['type']
51

52
    # スキル起動時（「アレクサ、クロードトークを開いて」）
53
    if request_type == 'LaunchRequest':
54
        return handle_launch_request(event)
55
    # ユーザーが何か話しかけた時
56
    elif request_type == 'IntentRequest':
57
        return handle_intent_request(event)
58
    # セッション終了時（タイムアウトやエラー）
59
    elif request_type == 'SessionEndedRequest':
60
        return handle_session_ended_request(event)
61
    else:
62
        return build_response("すみません、よく分かりませんでした。")
63

64

65
def handle_launch_request(event):
66
    """スキル起動時の処理"""
67
    # コストチェック（起動時のみ）
68
    cost_check = check_monthly_cost()
69

70
    if cost_check['is_exceeded']:
71
        return build_response(
72
            f"申し訳ありません。今月の利用上限{COST_LIMIT_USD}ドルに達したため、クロードトークは一時停止中です。現在の利用額は{cost_check['current_cost']:.2f}ドルです。来月またお話しましょう。",
73
            should_end_session=True
74
        )
75

76
    speech = "クロードトークを起動しました。何でも話しかけてください。"
77
    return build_response(speech, should_end_session=False)
78

79

80
def handle_intent_request(event):
81
    """インテント処理"""
82
    intent_name = event['request']['intent']['name']
83

84
    # 会話インテント（ユーザーの発話を処理）
85
    if intent_name == 'ConversationIntent':
86
        return handle_conversation_intent(event)
87
    # ヘルプ（「ヘルプ」「使い方を教えて」）
88
    elif intent_name == 'AMAZON.HelpIntent':
89
        return handle_help_intent()
90
    # 終了（「終了」「ストップ」「キャンセル」）
91
    elif intent_name in ['AMAZON.CancelIntent', 'AMAZON.StopIntent']:
92
        return handle_stop_intent()
93
    # 聞き取れなかった時
94
    elif intent_name == 'AMAZON.FallbackIntent':
95
        return handle_fallback_intent()
96
    else:
97
        return build_response("すみません、よく分かりませんでした。", should_end_session=False)
98

99

100
def handle_conversation_intent(event):
101
    """会話インテントの処理"""
102
    try:
103
        # ユーザー入力を取得
104
        slots = event['request']['intent'].get('slots', {})
105
        user_input = slots.get('UserInput', {}).get('value', '')
106

107
        if not user_input:
108
            return build_response(
109
                "すみません、聞き取れませんでした。もう一度話しかけてください。",
110
                should_end_session=False
111
            )
112

113
        logger.info(f"User input: {user_input}")
114

115
        # セッション属性から会話履歴を取得（初回は空）
116
        session_attributes = event.get('session', {}).get('attributes', {}) or {}
117
        conversation_history = session_attributes.get('history', [])
118

119
        # 会話履歴にユーザー入力を追加
120
        conversation_history.append({
121
            "role": "user",
122
            "content": user_input
123
        })
124

125
        # Bedrockで応答を生成
126
        start_time = time.time()
127
        ai_response = get_bedrock_response(conversation_history)
128
        elapsed_time = time.time() - start_time
129
        logger.info(f"Bedrock response time: {elapsed_time:.2f}s")
130

131
        # 会話履歴にAI応答を追加
132
        conversation_history.append({
133
            "role": "assistant",
134
            "content": ai_response
135
        })
136

137
        # 履歴が長くなりすぎたら古いものを削除（直近30往復まで）
138
        if len(conversation_history) > 60:
139
            conversation_history = conversation_history[-60:]
140

141
        # セッション属性を更新
142
        session_attributes['history'] = conversation_history
143

144
        return build_response(
145
            ai_response,
146
            should_end_session=False,
147
            session_attributes=session_attributes
148
        )
149

150
    except Exception as e:
151
        logger.error(f"Error in conversation: {str(e)}", exc_info=True)
152
        return build_response(
153
            "すみません、エラーが発生しました。もう一度話しかけてください。",
154
            should_end_session=False
155
        )
156

157

158
def get_bedrock_response(conversation_history):
159
    """Bedrockを呼び出してAI応答を取得"""
160
    try:
161
        response = bedrock.invoke_model(
162
            modelId=MODEL_ID,
163
            body=json.dumps({
164
                "anthropic_version": "bedrock-2023-05-31",
165
                "max_tokens": 500,
166
                "system": SYSTEM_PROMPT,
167
                "messages": conversation_history
168
            }),
169
            contentType='application/json'
170
        )
171

172
        # レスポンスからAIの応答テキストを取得
173
        response_body = json.loads(response['body'].read())
174
        ai_response = response_body['content'][0]['text']
175

176
        logger.info(f"AI response: {ai_response}")
177
        return ai_response
178

179
    except Exception as e:
180
        logger.error(f"Bedrock error: {str(e)}", exc_info=True)
181
        raise
182

183

184
def handle_help_intent():
185
    """ヘルプインテントの処理"""
186
    speech = "クロードトークでは、何でも話しかけることができます。質問したり、雑談したり、自由に会話を楽しんでください。"
187
    return build_response(speech, should_end_session=False)
188

189

190
def handle_stop_intent():
191
    """停止インテントの処理"""
192
    speech = "クロードトークを終了します。またお話ししましょう。"
193
    return build_response(speech, should_end_session=True)
194

195

196
def handle_fallback_intent():
197
    """フォールバックインテントの処理"""
198
    speech = "すみません、うまく聞き取れませんでした。もう一度話しかけてください。"
199
    return build_response(speech, should_end_session=False)
200

201

202
def handle_session_ended_request(event):
203
    """セッション終了時の処理"""
204
    logger.info("Session ended")
205
    return build_response("", should_end_session=True)
206

207

208
def calculate_cost(input_tokens, output_tokens):
209
    """トークン数からコスト（USD）を計算"""
210
    input_cost = input_tokens * INPUT_TOKEN_PRICE
211
    output_cost = output_tokens * OUTPUT_TOKEN_PRICE
212
    return input_cost + output_cost
213

214

215
def check_monthly_cost():
216
    """CloudWatchメトリクスから月間コストを計算"""
217
    logger.info(f"Starting cost check. Limit: ${COST_LIMIT_USD}")
218

219
    try:
220
        # 月初から現在までの期間を設定
221
        now = datetime.now()
222
        start_of_month = datetime(now.year, now.month, 1)
223

224
        # トークン数を取得
225
        total_input_tokens = get_metric_sum(MODEL_ID, 'InputTokenCount', start_of_month, now)
226
        total_output_tokens = get_metric_sum(MODEL_ID, 'OutputTokenCount', start_of_month, now)
227

228
        # コスト計算
229
        current_cost = calculate_cost(int(total_input_tokens), int(total_output_tokens))
230
        is_exceeded = current_cost >= COST_LIMIT_USD
231

232
        logger.info(f"Monthly cost check: ${current_cost:.4f} / ${COST_LIMIT_USD} (Input: {int(total_input_tokens)}, Output: {int(total_output_tokens)})")
233

234
        if is_exceeded:
235
            logger.warning(f"Cost limit exceeded! ${current_cost:.2f} >= ${COST_LIMIT_USD}")
236

237
        return {
238
            'is_exceeded': is_exceeded,
239
            'current_cost': current_cost,
240
            'limit': COST_LIMIT_USD
241
        }
242

243
    except Exception as e:
244
        logger.error(f"Error checking cost: {e}", exc_info=True)
245
        # エラー時は安全のため続行を許可
246
        return {'is_exceeded': False, 'current_cost': 0, 'limit': COST_LIMIT_USD}
247

248

249
def get_metric_sum(model_id, metric_name, start_time, end_time):
250
    """CloudWatchメトリクスの合計値を取得"""
251
    try:
252
        response = cloudwatch.get_metric_data(
253
            MetricDataQueries=[
254
                {
255
                    'Id': 'token_count',
256
                    'MetricStat': {
257
                        'Metric': {
258
                            'Namespace': 'AWS/Bedrock',
259
                            'MetricName': metric_name,
260
                            'Dimensions': [
261
                                {'Name': 'ModelId', 'Value': model_id}
262
                            ]
263
                        },
264
                        'Period': 2592000,  # 30日
265
                        'Stat': 'Sum'
266
                    }
267
                }
268
            ],
269
            StartTime=start_time,
270
            EndTime=end_time
271
        )
272

273
        # 取得した値を合計して返す（データがなければ0）
274
        values = response['MetricDataResults'][0].get('Values', [])
275
        return sum(values) if values else 0
276

277
    except Exception as e:
278
        logger.warning(f"Failed to get metric {model_id}/{metric_name}: {e}")
279
        return 0
280

281

282
def build_response(speech, should_end_session=True, session_attributes=None):
283
    """Alexa応答を構築"""
284
    response = {
285
        "version": "1.0",
286
        "response": {
287
            "outputSpeech": {
288
                "type": "PlainText",
289
                "text": speech
290
            },
291
            "shouldEndSession": should_end_session
292
        }
293
    }
294

295
    if session_attributes:
296
        response["sessionAttributes"] = session_attributes
297

298
    # 会話を続ける場合はリプロンプトを追加（無言時にユーザーの発話を促す音声）
299
    if not should_end_session and speech:
300
        response["response"]["reprompt"] = {
301
            "outputSpeech": {
302
                "type": "PlainText",
303
                "text": "何か話しかけてください。"
304
            }
305
        }
306

307
    return response

5. コスト管理について

Bedrockのコストは低めですが、使いすぎ防止のためコスト管理機能を実装しています。

AWS Budgetsを使わない理由: AWS BudgetsのBudget Actions機能では、予算超過時にEC2やRDSを自動停止できますが、Bedrockは対象外です。また、コスト反映までに8〜12時間の遅延があるため、「予算を超えたら即座に制御」という用途には向きません。

そこで、CloudWatchメトリクスからトークン使用量を直接取得し、単価を掛けてコストを計算する方式を採用しました。スキル起動時にリアルタイムでチェックでき、シンプルに実装できます。

なお、コストチェックはスキル起動時（LaunchRequest）のみ実行しています。会話中は毎回チェックしないため、処理負荷を抑えられます。

6. CloudWatchメトリクスの確認

コード内で使用しているInputTokenCountやOutputTokenCountなどのメトリクスは、CloudWatchコンソールの「メトリクス」→「Bedrock」→「モデルID別」で確認できます。

CloudWatchメトリクス

7. Alexaスキルの作成

Alexa Developer Console ⧉でスキルを作成します。Alexa Developer Consoleは、Alexaスキルの作成・管理ができるWebコンソールです。

スキル一覧

「スキルの作成」をクリックし、以下の設定で作成します。

Step 1: 名前、ロケール

スキル名の設定

項目	値
スキル名	AIチャット
プライマリロケール	日本語

Step 2: エクスペリエンス、モデル、ホスティングサービス

エクスペリエンスタイプの選択

項目	値
エクスペリエンスのタイプ	その他
モデル	カスタム

ホスティングサービスの選択

項目	値
ホスティングサービス	独自のプロビジョニング

個人のAWSアカウントのLambdaを使用するため「独自のプロビジョニング」を選択します。

Step 3: テンプレート

テンプレートの選択

項目	値
テンプレート	スクラッチで作成

8. Interaction Modelの設定

スキルの対話モデルを設定します。

呼び出し名の設定

呼び出し名を「クロードトーク」に設定します。「アレクサ、クロードトークを開いて」で起動できます。

補足: 最初は「AIチャット」にしていましたが、発音が似ている曲名があるようでSpotifyが起動してしまうことがありました。そのため、固有名詞的な呼び出し名にすることで解決しました。

JSON Editorでの設定

JSON Editor

左メニューの「JSON Editor」を開き、以下のInteraction Model JSONを貼り付けて「Save」を押下します。

AMAZON.Languageスロットタイプを使用して、ユーザーの発話を受け取ります。

なぜAMAZON.SearchQueryではなくAMAZON.Languageを使うのか

Alexaスキルで自由入力を受け取る場合、一般的にはAMAZON.SearchQueryというスロットタイプを使用します。しかし、このスロットには以下の制約があります。

サンプル発話にキャリアフレーズ（「〇〇を検索」など固定フレーズ）が必要
他のスロットタイプと同時に使用できない

今回のスキルでは、スキル起動後に何を言ってもAIが応答するようにしたいため、キャリアフレーズなしで{UserInput}だけを登録できるスロットタイプが必要でした。

AMAZON.Languageは言語名のリスト（「日本語」「英語」など）を定義したスロットタイプですが、リスト型スロットはサンプル発話にスロットのみを含めることが許可されています。この仕組みを利用して、ユーザーの自由な発話を受け取れるようにしています。

Interaction Model JSON

1
{
2
    "interactionModel": {
3
        "languageModel": {
4
            "invocationName": "クロードトーク",
5
            "intents": [
6
                {
7
                    "name": "AMAZON.CancelIntent",
8
                    "samples": []
9
                },
10
                {
11
                    "name": "AMAZON.HelpIntent",
12
                    "samples": []
13
                },
14
                {
15
                    "name": "AMAZON.StopIntent",
16
                    "samples": []
17
                },
18
                {
19
                    "name": "AMAZON.NavigateHomeIntent",
20
                    "samples": []
21
                },
22
                {
23
                    "name": "ConversationIntent",
24
                    "slots": [
25
                        {
26
                            "name": "UserInput",
27
                            "type": "AMAZON.Language"
28
                        }
29
                    ],
30
                    "samples": [
31
                        "{UserInput}"
32
                    ]
33
                }
34
            ],
35
            "types": []
36
        }
37
    }
38
}

9. LambdaとAlexaスキルの連携

Lambda側の設定

Lambda関数にAlexaトリガーを追加します。

トリガーを追加

Alexaトリガーの設定

項目	値
ソース	Alexa
Alexa製品	Alexa Skills Kit
スキルID検証	有効
スキルID	Alexa Developer ConsoleのEndpoint設定画面「Your Skill ID」で確認

トリガー追加完了

Alexaスキル側の設定

Endpoint設定で、Lambda関数のARNを設定します。

エンドポイントの設定

10. スキルのビルドとテスト

設定が完了したら、画面右上の「Build skill」ボタンを押下してスキルをビルドします。

Build skill

テストタブでシミュレーターを使ってテストできます。

テストの実行

会話テスト

おわりに

Amazon BedrockのClaude Sonnet 4.5を使って、Alexaと音声で会話できるスキルを作成しました。

実際に作ってみることで、以下の理解が深まりました。

Bedrockの呼び出し方法とJP Cross-Region Inference
Alexaスキルの構造とLambdaとの連携
IAMポリシーの設計
CloudWatchメトリクスを使ったコスト計算

短い会話であれば100回行ったとしても$0.50（約75円）程度で収まるため、気軽に試せます。

参考

記事をシェアする