transformerlab-app
transformerlab-app copied to clipboard

Published 20 hours ago •

Reame
Issues

Gemma2 inference issues on fastchat and mlx server

Open dadmobile opened this issue 6 months ago • 0 comments

Using Gemma 2 9B IT:

on Fastchat it returns "Hello Hello Hello Hello Hello..."
on MLX it returns a correct answer but ends with "<end_of_turn>"

Aug 16 '24 20:08 dadmobile