DeepSeek-VL
DeepSeek-VL copied to clipboard
是否评估过有作为web或者windows的agent的潜力?
如题。 目前开源的多模态大模型似乎都只有有限的agent能力,要么不能完全理解文字,要么图像识别能力无法兼顾,要么没有任务规划能力,要么缺乏函数调度或者解释器能力。
deepseek目前的模型里,67B有文本agent的潜力,但是太大。
很期待deepseek在agent领域的发力。