aicoco icon indicating copy to clipboard operation
aicoco copied to clipboard

爱可可微博热门分享(1.11)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. cutword:一个中文分词库,其字典文件根据最新数据统计得到,词频更加合理,分词速度是结巴分词的两倍 No 2. AI行业四大战场——数据之战、GPU贫富之战、多模态之战、RAG/运维之战 No 3. DeepSeekMoE 16B :DeepSeek开源的大语言模型,采用了创新的混合专家(MoE)架构,包括细粒度的专家分段和共享专家隔离两个主要策略。该模型是从头开始训练的,使用了2T个Token,性能与DeekSeek 7B和LLaMA2 7B相媲美,但计算量仅为其40%左右 No 4. 大模型的“涌现能力”可能并不只是规模的直接结果,而是学习过程中某种形式的“认知重组”或“知识内化”,类似于人类认知发展中的某些阶段性质变。例如,儿童在某个年龄段突然能够掌握抽象思维,不仅仅是知识量的增加,而是认知结构的根本改变——所以,大模型“认知发展”阶段的研究也很值得期待。//大模型“涌现现象”存在吗 ...... No 5. 早![太阳] ​ No 6. 用 Unsloth 和 TRL(Transformer Runtime Library) 将 LLM 微调速度提高 2 倍 No 7. GPT Store发布 No 8. LLM匿名竞技场最新排名:Mixtral 8x7b 跃居最佳开放模型,Mistral-Medium排名仅次于GPT-4 No 9. 基于新版Transformers.js v2.14制作的SAM在线本地推断Demo,可以直接在浏览器中为场景中的目标生成高质量的分割Mask No 10. 音乐人声分离工具:极简的人声和背景音乐分离工具,本地化网页操作,无需连接外网,使用 2stems/4stems/5stems 模型 No 11. 免费书稿《深度学习数学导论:方法、实现和理论》 No 12. Teamlinker:团队协作平台,集成了多功能模块,包括联系人、任务管理、会议、即时通讯、Wiki和文件管理 No 13. LAiW:中文法律大模型综合性基准(狴犴) No 14. AIlice:轻量级AI代理,同时也是一个简单的开发框架,用于快速构建和尝试各种AI智能体的想法 No 15. Nebula engine:C++游戏引擎,游戏引擎,特色包括完全基于数据驱动的设计、高性能数据结构套件、多线程支持、SSE加速的数学库、完整支持Python脚本、先进的渲染框架和着色器、性能测试工具和性能分析工具等 No 16. 免费书稿《数学分析(第二卷)》 No 17. Promptuity:提供交互式提示的库,具有高度可扩展性,允许你从头开始构建自己的提示,主要用于Rust语言,可以用于构建命令行工具和交互式应用程序 No 18. 涌现现象与基准数据集的难度分布有关。如果难度梯度分布广泛,模型规模增长带来的是由易到难样本数量的连续改善,不会有显著的涌现点出现。如果数据集难度较为一致,模型在某一规模阶段可能会经历突然能高效处理大多数样本的显著跳跃,形成明显的涌现。涌现现象依赖于如何选择和构建所用的基准数据集。//大模型“涌现现象”存在吗 ...... No 19. 大模型“涌现现象”存在吗 去年年初大家讲涌现讲得比较多,因为大模型存在涌现现象,所以大家都对大模型的发展非常乐观。涌现的本质是有些困难的任务小模型做不了,大模型突然就能做了,这自然带给大家对未来乐观的预期:就是说我将来把模型做得更大一点,现在尽管很多事都做不好,但是将来一 ...... No 20. LLaMa2lang v0.3:用于将LLaMa2-7b模型进行语言微调的便捷脚本集合,以适用于除英语以外的任何语言 No 21. 晚安~ [月亮] ​ No 22. SwiftInfer:基于TensorRT实现的Streaming-LLM技术,旨在支持LLM模型进行无限输入长度的推理 No 23. 几篇论文实现代码 No 24. Twinny:为VS Code设计的本地或API主机的AI代码补全插件,类似于GitHub Copilot,但完全免费和100%私密 No 25. 今日推介(第1281期):面向表格理解的演化表格推理链、线性递归特征机可证明恢复低秩矩阵、多粒度答案的开放域问答、用大型语言模型处理无限序列长度的免费午餐、基于单非自回归Transformer的掩码音频生成 ...... No 26. 通过无约束生成对中文大型语言模型的幻觉产生进行基准测试 No 27. 图解AI开放状况(数据来源:Coatue): 从模型代码、模型权重、训练数据、模型评估、架构决策和商业许可的开放性等方面,对比了主流的AI模型——GPT-2、GPT-3、GPT-4、LaMA(来自Meta)、LaMA-2和Mistral-7B的开放程度。 ...... No 28. AI Toolkit:用于构建游戏NPC智能控制系统的C++头文件库,提供有限状态机、行为树、实用AI和目标导向行动规划等功能 No 29. AI Gateway:高性能的AI路由,具有极快速和友好的API,可以将请求路由到100+个LLM(Language Model Model),提供了一个统一的接口,方便使用者与多个LLM进行交互,并支持生成式AI和语言链等功能 No 30. [CL]《Mixtral of Experts》 No 31. #转发赠书#携手@博文视点Broadview 送出5本《左耳听风:传奇程序员练级攻略》 No 32. [CL]《Blending Is All You Need: Cheaper, Better Alternative to Trillion-Parameters LLM》 No 33. 妆容迁移/发型迁移相关资源列表 No 34. 《‌​⁢‍⁡​⁢​⁤‍​⁣​​⁢​⁣​‍​​⁡​‍​​​⁤‍⁣⁤⁣‌涓海录AIGC学习文档 - 飞书云文档》 No 35. 'cloudflare-ai-web - 支持GeminiPro Vision / Cloudflare Workers ...... No 36. '开源大模型食用指南 - 基于AutoDL快速部署开源大模型,提供完整指南,包括环境配置、部署和微调,助你轻松掌握各类大模型应用' ...... No 37. SmartExcel.cc:使用人工智能生成所需Excel公式的工具,利用ChatGPT API和Vercel AI SDK进行实时交互,通过Vercel Edge Function将其发送到ChatGPT API,然后将响应流式传输回应用界面 No 38. 提示工程职业化的反思 No 39. Local AI Voice Chat:基于Zephyr 7B模型使用自定义语音进行本地AI对话,使用RealtimeSTT和faster_whisper进行转录,使用RealtimeTTS和Coqui XTTS进行语音合成,提供了一个实时的聊天机器人,可以进行语音交互 No 40. [CV] MagicVideo-V2: Multi-Stage High-Aesthetic Video Generation ...... No 41. [CV] Let's Go Shopping (LGS) -- Web-Scale Image-Text Dataset ...... No 42. [CL]《Chain-of-Table: Evolving Tables in the Reasoning Chain for Table Understanding》 No 43. [CL]《Lightning Attention-2: A Free Lunch for Handling Unlimited Sequence Lengths in Large Language Models》 No 44. [CL] From LLM to Conversational Agent: A Memory Enhanced Architecture ...... No 45. [AS] DiarizationLM: Speaker Diarization Post-Processing ...... No 46. 近年来AI发展里程碑论文集锦: - Transformers: Attention is All You Need 提出了Transformer模型,完全基于注意力机制,摒弃了以往模型依赖的递归和卷积结构,为自然语言处理领域带来了革命性的影响,并极大地提高了机器翻译任务的效率和准确性。 ...... No 47. KAIST课程《3D数据机器学习》,内容涵盖了深度学习在处理和分析3D数据方面的最新进展,包括计算机视觉、计算机图形学和机器人领域的应用 No 48. [CV] A Survey on 3D Gaussian Splatting 网页链接 3D高斯Splatting(3D ...... No 49. [CL] AST-T5: Structure-Aware Pretraining for Code Generation ...... No 50. chatllm-vscode:VSCode扩展,允许以灵活和长篇的方式与LLM API进行交互,支持各种LLM APIs (currently OpenAI, Together, Google)

fly51fly avatar Jan 11 '24 14:01 fly51fly