dbc-2024
dbc-2024
my code: ```java DocumentParser documentParser = new ApacheTikaDocumentParser(); Document document = documentParser.parse(new FileInputStream("C:\\Users\\Samisen\\Desktop\\a.txt")); DocumentByCharacterSplitter documentByCharacterSplitter = new DocumentByCharacterSplitter(50, 10); List textSegmentList = documentByCharacterSplitter.split(document); textSegmentList.forEach(textSegment -> { System.out.println("============="); System.out.println(textSegment.text()); }); ```...
> @dbc-2024 could you please provide more info on what exactly is not working? How do you expect it to work? https://github.com/langchain4j/langchain4j/issues/1724#issuecomment-2335028410
> 都加上去的话太重了,不好维护,得累死。 RESTFUL里面加上可行?毕竟RAG应用,必须架设向量/重排服务,如果向量数据库里面自带方便非PY的开发人员。
pySDK里面的向量,本质是客户端本地做的?
> 没必要,不然容易被Embedding版本更新带着走,增加维护难度,我理解milvus既然是做向量库就集中做向量库,别像Langchain那样;我自己是这么干的,写一个springboot服务专门用来管向量库,另外再起一个fastapi服务专门去调那些embedding官方的接口,词嵌入做完了再给到springboot服务 目前我们也是。只是fastapi这块挂不同模型不太想维护。哈哈
/reopen