Google上周開(kāi)源了語(yǔ)音命令資料集( Speech Commands Dataset),可望加速開(kāi)發(fā)人員打造支援語(yǔ)音命令的各種應(yīng)用。
此一語(yǔ)音命令資料集是由數(shù)千名不同的使用者念出30種命令文字,迄今總計(jì)采集了6.5萬(wàn)個(gè)只有1秒的語(yǔ)音檔。這些文字涵蓋了Yes、No、Up、Down、Left、Right、On、Off、Stop、Go,以及數(shù)字等,方便開(kāi)發(fā)人員用來(lái)訓(xùn)練應(yīng)用程式的基本語(yǔ)音介面。
迄今Google已開(kāi)源多項(xiàng)人工智慧專(zhuān)案,包含機(jī)器學(xué)習(xí)技術(shù)TensorFlow、自造者AI專(zhuān)案—AIY,以及用來(lái)采集語(yǔ)音片段的Open Speech Recording網(wǎng)路程式。
此外語(yǔ)音命令資料集是由TensorFlow與AIY團(tuán)隊(duì)共同建立,以用它來(lái)增加TensorFlow的訓(xùn)練與介面樣本程式,Google預(yù)期開(kāi)源後的資料集數(shù)量將會(huì)持續(xù)成長(zhǎng),以帶來(lái)更多不同的口音。