olivebot/test/test_record.py
guo zebin 4cfad5ae0f 年翻更新
- 全新ui
- 全面优化websocket逻辑,提高数字人和ui连接的稳定性及资源开销
- 全面优化唤醒逻辑,提供稳定的普通唤醒模式和前置词唤醒模式
- 优化拾音质量,支持多声道麦克风拾音
- 优化自动播放服务器的对接机制,提供稳定和兼容旧版ue工程的对接模式
- 数字人接口输出机器人表情,以适应新fay ui及单片机的数字人表情输出
- 使用更高级的音频时长计算方式,可以更精准控制音频播放完成后的逻辑
- 修复点击关闭按钮会导致程序退出的bug
- 修复没有麦克风的设备开启麦克风会出错的问题
- 为服务器主机地址提供配置项,以方便服务器部署
2024-10-26 11:34:55 +08:00

85 lines
2.6 KiB
Python

import wave
import numpy as np
import pyaudio
def save_audio_to_wav(data, sample_rate, filename):
# 确保数据类型为 int16
if data.dtype != np.int16:
data = data.astype(np.int16)
# 打开 WAV 文件
with wave.open(filename, 'wb') as wf:
# 设置音频参数
n_channels = 1 # 单声道
sampwidth = 2 # 16 位音频,每个采样点 2 字节
wf.setnchannels(n_channels)
wf.setsampwidth(sampwidth)
wf.setframerate(sample_rate)
wf.writeframes(data.tobytes())
def process_audio_data(audio_data_list, channels):
# 将累积的音频数据块连接起来
data = b''.join(audio_data_list)
# 将字节数据转换为 numpy 数组
data = np.frombuffer(data, dtype=np.int16)
# 重塑数组,将数据分离成多个声道
data = np.reshape(data, (-1, channels))
# 对所有声道的数据进行平均,生成单声道
mono_data = np.mean(data, axis=1).astype(np.int16)
return mono_data
# 示例使用
def main():
# 音频参数
sample_rate = 44100 # 采样率
channels = 1 # 声道数(根据您的实际情况)
chunk_size = 1024 # 每次读取的帧数
record_seconds = 5 # 录音时长
output_filename = 'output.wav' # 输出文件名
# 初始化 PyAudio
p = pyaudio.PyAudio()
device_info = p.get_device_info_by_index(0)
# channels = device_info.get('maxInputChannels', 1)
print(channels)
sample_rate = int(device_info.get('defaultSampleRate', 44100))
stream = p.open(format=pyaudio.paInt16,
channels=channels,
rate=sample_rate,
input=True,
frames_per_buffer=chunk_size)
print("开始录音...")
audio_data_list = []
# 录音循环
for _ in range(int(sample_rate / chunk_size * record_seconds)):
data = stream.read(chunk_size)
data = np.frombuffer(data, dtype=np.int16)
# 重塑数组,将数据分离成多个声道
data = np.reshape(data, (-1, channels))
# 对所有声道的数据进行平均,生成单声道
mono = np.mean(data, axis=1).astype(np.int16)
# 转换回字节格式
data = mono.tobytes()
audio_data_list.append(data)
print("录音结束。")
# 停止并关闭流
stream.stop_stream()
stream.close()
p.terminate()
# 处理音频数据
mono_data = process_audio_data(audio_data_list, channels)
# 保存为 WAV 文件
save_audio_to_wav(mono_data, sample_rate, output_filename)
print(f"音频已保存为 {output_filename}")
if __name__ == '__main__':
main()