{Transcribe}音声を文字起こしする

 

https://aws.amazon.com/jp/getting-started/hands-on/create-audio-transcript-transcribe/

 


-- 1. コマンド等のインストール

-- 1.1 aws cli version 2 インストール

curl "https://awscli.amazonaws.com/awscli-exe-linux-x86_64.zip" -o "awscliv2.zip"
unzip awscliv2.zip
sudo ./aws/install
aws --version

 

-- 1.2 jqインストール
sudo yum -y install jq

 

-- 2. S3 バケットを作成する

aws s3 mb s3://bucket123

aws s3 ls

-- 3. バケットに音声ファイルをアップロードする

 

aws s3 cp standard.mp3 s3://bucket123
aws s3 cp test.mp3   s3://bucket123

aws s3 ls s3://bucket123 --recursive

 

-- 4. 文字起こしジョブを作成する

aws transcribe start-transcription-job \
--transcription-job-name job01 \
--language-code en-US \
--media-format mp3 \
--media MediaFileUri=s3://bucket123/standard.mp3 \
--output-bucket-name bucket123 \
--output-key output01

aws transcribe start-transcription-job \
--transcription-job-name job02 \
--language-code ja-JP \
--media-format mp3 \
--media MediaFileUri=s3://bucket123/test.mp3 \
--output-bucket-name bucket123 \
--output-key output02

aws transcribe list-transcription-jobs


-- 5. 文字起こしの結果を確認する

aws transcribe get-transcription-job \
--transcription-job-name job01

aws transcribe get-transcription-job \
--transcription-job-name job02

aws s3 ls s3://bucket123 --recursive

aws s3 cp s3://bucket123/output01 -
aws s3 cp s3://bucket123/output02 -

 

-- 6. クリーンアップ

-- 文字起こしジョブの削除
aws transcribe list-transcription-jobs

aws transcribe delete-transcription-job \
--transcription-job-name job01

aws transcribe delete-transcription-job \
--transcription-job-name job02


-- バケットの削除
aws s3 ls

aws s3 rb s3://bucket123 --force