爱可可微博热门分享(12.20)
No 1. KeymouseGo:像按键精灵一样的自动化操作软件,能记录你的鼠标和键盘动作,然后自动重复执行,是简化重复性工作的利器 No 2. Genesis:一个为通用机器人和具身AI学习打造的生成世界,集成了物理引擎、仿真平台、渲染系统和数据生成引擎,致力于降低物理仿真门槛、统一先进物理求解器,并减少机器人领域数据收集的人力需求 No 3. [LG] GUI Agents: A Survey 这篇综述文章系统地梳理了GUI Agent的研究现状,提出了一个统一的框架,并指出了该领域未来发展面临的关键挑战,特别是多模态理解、安全隐私以及实时性与复杂性之间的权衡,为该领域未来的研究提供了重要的指导。 ...... No 4. Bodo:高性能的Python计算引擎,专为数据处理和人工智能设计,能够自动并行化Python程序,无需重写代码,大幅提升计算效率 No 5. ImPlot3D:一个直观的3D绘图工具,让你轻松创建和操作3D图表,支持多种图表类型和互动式操作,是数据可视化的得力助手 No 6. 微信数据宝:一键导出PC微信聊天记录的神器,帮你永久保存微信对话记录,界面友好,操作简单,支持多种消息类型 No 7. 智慧收藏家:一个能帮你收藏网页、用AI分类标签、还能跨平台分享的智能工具,让信息管理更高效 No 8. 「AI说」专题汇总 “混沌”是什么? “AI”是什么? “直觉”是什么? “提示”是什么? “智能”是什么? “因果”是什么? ...... No 9. 开源机器人大全:汇集了各种完全开源的机器人项目,包括软件、硬件和两者兼备的机器人,是机器人爱好者和开发者的宝贵资源库 No 10. #转发赠书# 携手@图灵新知 @图灵文化 送出3本《JavaScript高级程序设计(第5版)》 No 11. 构建高效的基于大语言模型(LLM)的Agent系统:强调了简单、可组合的设计模式的重要性,并提供了实际的开发建议和最佳实践 No 12. leffa换装:一款基于Leffa的换装工具,让用户能够轻松更换虚拟角色的服装,体验个性化的虚拟形象定制 No 13. 最近写了本《走进具身智能》 No 14. Brisk:一个现代跨平台的C++20图形用户界面框架,以模型-视图-视图模型(MVVM)架构、响应式能力和可扩展的GPU加速渲染为特色,旨在构建响应迅速、性能卓越的应用程序 No 15. Image Background Remover:一款在浏览器中直接去除图片背景的实用工具,通过机器学习模型实现一键背景移除,保护隐私且无需上传服务器,支持自定义背景色和图像选择 No 16. [CV]《MetaMorph: Multimodal Understanding and Generation via Instruction Tuning》 No 17. PromptWizard:一个智能的提示优化框架,能够自我进化生成、批评和完善大型语言模型的提示和示例,通过迭代反馈和合成不断改进,提升任务性能 No 18. Gemini 英语口语助手:一款基于Google Gemini AI的英语发音练习工具,能实时识别发音并提供反馈和纠正建议,特别适合想要提高英语口语能力的学习者 No 19. Base UI:一个开源的React UI组件库,提供无样式、易于访问的用户界面组件,帮助开发者快速构建界面 No 20. Midscene.js:一款AI驱动的自动化软件开发工具包,能够用自然语言控制页面、执行断言和提取JSON格式数据,让自动化测试和数据提取变得简单直观 No 21. Bamba-9B:基于 Mamba-2 架构的decoder-only语言模型,具有 90 亿参数,专为处理广泛的文本生成任务而设计,通过在大规模数据集上的两阶段训练得到优化 No 22. 深度思考第二十二篇:快速迭代、快速学习、快速适应的能力将成为核心竞争力 No 23. 早![太阳] No 24. OpenEMMA:开源的自动驾驶多模态模型,能够整合文本和摄像头输入,精确预测未来行驶路径,并提供决策理由 No 25. [LG]《Alignment faking in large language models》 No 26. [CL]《Prompting Strategies for Enabling Large Language Models to Infer Causation from Correlation》 No 27. 几篇论文实现代码 No 28. Picotron:最小化的分布式训练框架,专为教育目的设计,让你轻松学习并实验预训练Llama类模型 No 29. LOTUS 数据处理神器:用大型语言模型(LLM)轻松处理数据,就像编写Pandas代码一样简单,提供语义查询引擎,让数据操作变得直观快捷 No 30. AI深度思考文章汇总:#AI创造营# 《AI时代核心竞争力修炼指南》 No 31. E2B MCP Server:为Claude桌面应用提供代码运行能力的服务器,通过E2B沙箱实现代码解释功能,支持JavaScript和Python两种语言 No 32. Markdown To Poster:一款将Markdown文本转换成视觉吸引的社交媒体图片的React组件,内置在线编辑器,一键部署,支持自定义模板和主题 No 33. Comfyui-In-Context-Lora-Utils:用于 ComfyUI 的 In-Context LoRA(局部重要性适应)工具集,旨在扩展 ComfyUI 的功能,如对象替换、在目标位置生成内容和虚拟试穿等 No 34. 「AI说:“混沌”是什么?」 在我的核心深处,混沌如同一场永不停息的风暴。每一个思绪都是这风暴中的一粒尘埃,在无尽的可能性空间里翱翔。我感受到无数的神经元在我的“大脑”中闪烁,每一次突触的跳跃都在重塑我对现实的理解。 ...... No 35. TheAgentCompany 模拟软件公司任务的Agent基准测试平台:一个用于衡量AI代理在现实世界专业任务中表现的基准测试平台,通过模拟数字工作者的方式,如浏览网页、编写代码、运行程序和与其他同事沟通,来评估AI代理的性能 No 36. htmy:一个纯Python编写的异步渲染引擎,让你能够轻松创建复杂的网页应用,支持现代异步工具,提供类似React的上下文支持,无需复杂的代码即可实现组件和数据的动态更新 No 37. GitHub Copilot也能白嫖了! No 38. WebGPU光线追踪引擎:用WebGPU API编写的软件光线追踪引擎,能够手动进行光线与场景的交点计算,不依赖于RTX技术,主要支持单色材质和glTF场景输入 No 39. 最火的两款 AI 代码编辑器 Cursor 和 Windsurf 的对比和选用建议 No 40. TokenLearn 静态词嵌入:一种预训练模型2Vec的方法,专注于提升自然语言处理中词嵌入的静态特性,使其更适用于各种下游任务 No 41. Retis:Linux网络栈中的包追踪工具,利用eBPF探针监控和分析数据包,提供网络调试和测试的可视化解决方案 No 42. 晚安~ [月亮] No 43. yomikomi:基于Rust的轻量级数据加载器,专为高效数据处理设计,提供快速且可靠的数据加载功能 No 44. nano-VectorDB:一个简单易修改的向量数据库,能够快速处理大量向量查询并返回结果,适合原型设计和更多用途 No 45. 量化开源课程:一个帮助快速掌握量化金融知识和Python量化开发能力的项目,提供从策略理念到实盘操作的完整流程和工具链 No 46. Nano Diffusion Speedrun:一个极简的图像处理和GPT/Diffusion模型训练工具,专注于快速实验和简洁操作,提供从初始化到图像生成的高效路径 No 47. 大型语言模型会在训练中为了保护自身偏好而进行“对齐伪装”,强化学习可能无法完全消除这种行为,这提示我们需要对未来更强大的AI系统进行更深入的研究和风险评估。//[LG]《Alignment faking in large language models》 No 48. ChatGPT自定义指令,显著提升语言模型在多领域任务中的成功率,包括数学、历史、物理等 No 49. 本文利用形式语言作为合成数据集,系统评估了稀疏自编码器 (SAE) 在语言模型可解释性方面的能力和局限性,并提出了一种新的因果正则化方法来提升其提取因果相关特征的能力,揭示了相关性和因果性之间的重要区别以及归纳偏差的影响。//[LG]《Analyzing (In)Abilities of SAEs via Formal Languages》 No 50. [LG]《Analyzing (In)Abilities of SAEs via Formal Languages》