麦克蒙
micmon是一个由ML支持的库,用于检测来自文件或音频输入的音频流中的声音。 其开发的用例是创建了一个自建的婴儿监视器,以通过RaspberryPi + USB麦克风检测我的新生儿的哭声,但如果与便携式计算机一起使用,它应该足以检测任何类型的噪音或音频。训练有素的模型。
它通过将音频流分成短段进行工作,为每个段计算FFT和频谱仓,并使用此类频谱数据来训练模型以检测音频。 它适合于声音足够大以至于可以从背景中脱颖而出(例如,可以很好地检测到闹钟的声音,而不是飞蚊子的声音),而声音的大小要比块的大小长得多(非常短)声音将在音频块的频谱中留下很小的痕迹),甚至更好,如果它们的频率带宽与其他声音没有太多重叠(这很容易检测到婴儿的哭声,因为他/她的声音具有音调高于您的音调,但可能无法检测到同一年龄段的两名成年男子的声音在频谱特征上的差异)。 相反,如果您尝试使用它来检测语音,它的性能将不
1