aws-transcribe-transcript
这是一个简单的实用程序脚本,可将Amazon Transcribe .json成绩单转换为更具可读性的成绩单。 它使用PHP,但是如果您有兴趣,可以使用此仓库。
亚马逊提供完善的转录服务,您可以让该服务识别发言人。 并且在他们的Web界面中,他们向您显示了一个完整的逐次播放记录,但仅限于前5,000个字符。 如果需要完整的成绩单,则必须下载其JSON文件。 但是,JSON文件仅将抄本作为一个大块,然后在下面提供一些结构化的数据,以用于各种发言者,开始时间和文本片段。
该脚本创建人类可读的笔录。
常规路线
从“工作详细信息”页面下载您的笔录。 文件名格式当前为asrOutput.json。
在下载的文件上运行transcript.php程序,即php ./transcript.php asrOutput.json
结果将以[FILENAME]-transcript.txt形式写入您当前的工作目录中
频道方向
提供了一个可选脚本,用于基于频道生成脚本。 您运行transcript_ch.php程序,它将在[FILENAME]-t
1