Will Wang

Results 379 comments of Will Wang

> 王老师好!现在我初步构思了几个毕设开题题目,想请您看看哪个选题比较合适,或者有没有什么修改建议。 > > 1. 基于 LLM 与 RAG 的播客内容智能问答系统 > 2. 面向播客内容的LLM智能问答系统 > 3. RAG驱动的播客内容智能问答系统 > 4. 基于大语言模型的播客智能问答系统 > 5. 面向播客内容的LLM智能处理系统 挺好,前面的大的方向和目标都没问题,然后像第一个题目就不错,目前不用关注具体的题目究竟是啥,等做了点东西和效果出来后,回过头再来看也行。 接下来可以设计一个简单起步的方案,然后边实践边完善起来了~

> 对比whisper,[阿里听悟](https://tingwu.aliyun.com/home)的音视频转录更加强大,包括转录、说话人分离以及用 LLM 进行后处理等功能。 [《后互联网时代的乱弹-第151期》处理结果](https://tingwu.aliyun.com/doc/transcripts/wg57n3eaj3ow9kr3?sl=1#%E3%80%8A151%E3%80%8B) 相当不错呀~

链接更新了,一共 17 各组织了(包括 OSI):https://unite.un.org/en/news/sixteen-organizations-endorse-un-open-source-principles

**AI 供应链分层框架(第一种模式,四层)** **1、核心资源层(供应链上游)** - 算力资源 - 芯片(GPU/TPU):英伟达、AMD、自研芯片(如Google TPU) - 服务器集群:超大规模计算中心(如CoreWeave) - 云计算:AWS/GCP/Azure的AI专用算力服务 - 管理重点:成本控制、供应商锁定风险、算力弹性调度 - 数据资源 - 训练数据集(如Common Crawl、专业领域数据) - 数据处理工具(数据清洗/标注/合成) - 数据合规基础设施(隐私计算、版权验证) - 管理重点:数据质量评估、版权争议规避、数据飞轮构建 **2、技术支撑层(供应链中游)** - 算法模型 - 基础大模型(GPT-4、Llama、Claude)...

另外,从我们的视角看,下面的综述风格,应该是我们更加熟悉的,可以重点考虑下: - 开源软件供应链研究综述:https://www.jos.org.cn/html/2024/2/6975.htm AI 供应链的三大要素: - **制品**(Artifact):供应链的组成(数据、模型、代码仓、软件包、文档等) - **流程**(Process):数据制品流程、模型制品流程、软件制品流程、知识制品流程等 - **关系**(Relationship):协作关系、依赖关系、复用关系、训练关系、调用关系、引用关系等 另外,给出供应链领域的部分术语,以便更好的从**供应链观**和**流程观**来审视个框架(来源:[运营管理:流程与供应链](https://item.jd.com/12994875.html)): - **流程(process)**:是任何一个或一组活动,这些活动利用一个或多个投入要素,对其进行转化,向其顾客提供一种或多种产出。 - **供应链(supply chain)**:是一个企业以及跨越多个不同企业的一系列相互关联的流程,这些企业提供服务或产品以满足顾客需求。 - **供应链管理(supply chain management)**:是使企业的流程与其供应商的流程及客户同步的过程,以使物流、服务流和信息流与客户需求相匹配。 - **运营(operation)**:是指完成一个或多个流程的全部或部分工作的一组资源。 - **运营管理(operations management)**:指对流程进行系统化的设计、指挥运营管理和控制,从而将投入转化为服务或产品,以满足内部顾客和外部顾客的需求。

目前,Model cards,Data cads 以及 System cards,也是一个不错的资源,可以支持到该项工作,部分参考如下: - [Towards Responsible AI: Model Cards for Transparent Machine Learning](https://medium.com/generative-ai-insights-for-business-leaders-and/towards-responsible-ai-model-cards-for-transparent-machine-learning-d494d05c09aa) - [Towards Responsible AI: Model Cards for Transparent Machine Learning](https://medium.com/generative-ai-insights-for-business-leaders-and/towards-responsible-ai-model-cards-for-transparent-machine-learning-d494d05c09aa) - [System cards](https://ai.meta.com/tools/system-cards/) -...

一个迭代后的框架如下图所示: 这样从综述的角度来看,可以做如下的考虑: 1. Introduction - AI 供应链的全球现状和战略意义 - 软件供应链 --> 大模型供应链 --> AI 供应链 3. Definition and Significance - **3.1 要素定义**:对要素层的内容进行详细综述 - 要素层:制品、流程、关系 - **3.2 AI 产业链**:对产业层的内容进行详细综述 - 产业层:核心资源、技术支撑、应用服务、生态治理 -...

> > 值得注意的是,依据ICML 2024和2025 的Position Track,接收的论文也设置有Spotlight,Oral并参与Best Paper评选,认可度高于Survey。但是需要小心的是,如果论文被reject,重投的可选会议较少,而且存在和其他投稿撞车的情况,因此选题格外重要。 非常棒的总结和建议,大家可以重点关注下~