faster-whisper-server faster-whisper-server output seems something wrong

faster-whisper-server output seems something wrong

Open burness opened this issue 11 months ago • 1 comments

After a certain segment, all subsequent recognized texts are incorrect：

from openai import OpenAI

client = OpenAI(api_key="cant-be-empty", base_url="http://192.168.31.100:8000/v1/")

audio_file = open("../../examples/test_02.mp3", "rb")
transcript = client.audio.transcriptions.create(
    model="Systran/faster-whisper-large-v3", file=audio_file
)
print(transcript.text)

I use the same file to transcript in faster_whisper, it seems ok

from faster_whisper import WhisperModel

model_size = "large-v3"

model = WhisperModel(model_size, device="cuda")
segments, info = model.transcribe("test_02.mp3", beam_size=5)

print("Detected language '%s' with probability %f" % (info.language, info.language_probability))

for segment in segments:
    print("[%.2fs -> %.2fs] %s" % (segment.start, segment.end, segment.text))

Can anybody help me ?

Nov 14 '24 15:11 burness

faster-whisper-server faster-whisper-server copied to clipboard

faster-whisper-server output seems something wrong

faster-whisper-server
faster-whisper-server copied to clipboard