aicoco

aicoco copied to clipboard

Reame
Issues

爱可可微博热门分享(9.3)

Open fly51fly opened this issue 1 year ago • 0 comments

No 1. Sapiens-Pytorch-Inference：用于Pytorch中人体基础模型推理的最小代码和示例，支持多种任务并行运行，自动下载模型，提供ONNX导出脚本 No 2. Melty：开源AI代码编辑器，专为10倍效率的工程师设计，能理解你的工作流，从终端到GitHub，协助你编写生产级别的代码 No 3. WechatFerry：基于微信的机器人底层框架，支持创建和维护微信机器人，提供灵活的API和模块化设计，便于开发者快速搭建和扩展 No 4. prof8：实验性论文写作检查工具，旨在帮助研究者优化文档写作质量，特色在于其短小精悍的规则集和与Zed AI助手的协同工作能力 No 5. [LG]《Training Ultra Long Context Language Model with Fully Pipelined Distributed Transformer》 No 6. AlphaFold3：开源实现的AlphaFold3项目，旨在推进开源生物分子结构预测，提供完整的AlphaFold3模型和训练代码，支持单链蛋白质预测，并计划增加配体、多聚体和核酸预测能力 No 7. [CL]《CLOCR-C: Context Leveraging OCR Correction with Pre-trained Language Models》 No 8. 从零开始的深度学习：为深度学习爱好者提供从基础到进阶的实践教程，包括Jupyter Notebook形式的代码，支持在云平台上执行，涵盖神经网络、变分自编码器等多个深度学习主题 No 9. #免费##抽奖# 携手@图灵新知 @图灵文化送出3本《大模型辅助软件开发》 No 10. WaloViz：开源交互式频谱图音频播放器，基于Bokeh和HoloViz堆栈构建，提供直观的音频可视化体验 No 11. [RO]《Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling》 No 12. NLP Zero to Hero：自然语言处理（NLP）领域的入门到精通教程，包含从分词器到Transformer架构的全面内容，旨在帮助学习者掌握NLP的核心概念并理解其发展脉络 No 13. Awesome-Composed-Image-Retrieval：复合式图像检索(CIR)论文集，涵盖属性驱动、监督式、少样本、零样本、半监督、对话式等多种CIR方法，以及基于草图的CIR和视频检索等 No 14. 携手@博文视点Broadview 送出3本《深度神经网络高效计算：大模型轻量化原理与关键技术》 No 15. [LG]《Beyond Preferences in AI Alignment》 No 16. Dawarich：自托管的Google位置历史记录（Google地图时间线）替代品，支持从Google地图时间线和Owntracks导入位置历史记录，查看地图上的轨迹并获取统计数据，如访问过的国家和城市数量、旅行的距离等 No 17. 早！[太阳] No 18. MistoControlNet-Flux-dev：专为Flux1-dev模型设计的ControlNet集合，支持各种线条草图和轮廓草图，具有双流Transformer结构，提高对齐和表现力 No 19. [LG]《Text2SQL is Not Enough: Unifying AI and Databases with TAG》 No 20. 晚安～ [月亮] No 21. 提出了CLOCR-C概念，通过语言模型的补全和适应上下文的能力改进OCR质量，顶级模型使字符错误率降低60%以上，并改进了下游命名实体识别任务。 No 22. 通过序列划分、双缓冲设计以及计算与访存的精心调度，实现了transformer在资源受限环境下对超长序列的高效训练。 No 23. 今日推介(第1517期)：闪电自注意力的几何学、超越偏好的人工智能对齐、通过闭环重采样改进动作分块、用全流水线分布式Transformer训练超长上下文语言模型、利用预训练语言模型进行上下文关联OCR校正 ...... No 24. QShop商城：轻量级、高性能的前后端分离电商系统，支持微信小程序，源码完全开源，适合快速搭建个性化独立商城，适用于学习与商业用途 No 25. 利用代数几何工具研究了闪电自注意力网络的几何性质，包括可识别性、维数公式、奇异点等，并对归一化自注意力提出猜想。//[LG]《Geometry of Lightning Self-Attention: Identifiability and Dimension》 No 26. HK_MEMS_Dataset：多激光雷达数据集，专注于极端环境下的SLAM研究，提供城市道路和隧道的汽车级MEMS激光雷达数据，旨在提升SLAM系统在极端环境中的鲁棒性 No 27. hf-mirror-cli：国内镜像加速下载Hugging Face模型的工具，无需配置即可快速获取海外数据集和模型，支持环境检测、网络容错、并发下载及断点续传功能 No 28. Vega：一款跨平台的视频编辑软件，支持视频、音频、图像和文本编辑，具备关键帧动画和多选功能，还拥有插件系统 No 29. ReHiFace-S：实时高保真换脸算法，开放数字人生成能力，开发者可轻松生成大规模的数字人，实现实时换脸功能 No 30. How Much VRAM：开源项目，用于估算模型训练或推理所需的内存，帮助用户决定所需硬件配置 No 31. SkyScript-100M：短剧剧本和拍摄脚本的大规模数据集，包含10亿对剧本和拍摄脚本，支持短剧视频生成和文本到视频领域的研究，推动剧本优化和视频生成技术的发展 No 32. 今日推介(第1516期)：通过参与语言模型Agent对话促进人类学习、扩展基于扩散和流的XGBoost模型、大型语言模型与图机器学习的结合、通过约束松弛改进等变模型训练、用TAG统一AI和数据库 ...... No 33. Yolo_Label：用于训练神经网络YOLO的图像对象边界框标记工具，具有高灵敏度和简化的标记方法，旨在减少标记过程中的手腕疲劳 No 34. Machine Learning from Scratch：一个机器学习算法的实现项目，专注于使用numpy库从零开始构建神经网络和Transformer模型，旨在帮助理解和学习机器学习的核心概念 No 35. SeqCausal：序贯因果推断工具包，专注于简单场景下的应用，通过逐步引入特征来节约计算成本 No 36. [LG]《Scaling Up Diffusion and Flow-based XGBoost Models》 No 37. 提出表增强生成模型，通过连接语言模型和数据库引擎的能力，作为回答数据库自然语言问题的统一通用范式，并构建基准测试证明这一领域还有大量挑战需求解决。 No 38. 提出双向解码算法，通过在测试时搜索最优行动样本，实现了行动分块在一致性和重活性间的高效平衡。//[RO]《Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling》 No 39. Awesome RAG：关于大型语言模型中检索增强生成（RAG）的精选列表，包括研究论文、资源、工具和其他相关集合 No 40. supertree：交互式决策树可视化工具，支持在Jupyter Notebooks等环境中以互动方式展示决策树，具备放大缩小、展开折叠节点等功能，直观探索树结构 No 41. 欢迎收听「走近具身智能」系列节目，带你了解具身智能的精彩世界！第四集知识从哪里来：具身智能与表征在线收听：http://t.cn/A6RNakqV ...... No 42. [LG]《Geometry of Lightning Self-Attention: Identifiability and Dimension》 No 43. WavTokenizer设计宽广的单层向量量化编码簿空间，配合上下文建模和逆傅里叶变换解码器，实现每秒仅需40或75个token的极致压缩，同时保持语音、音乐和音频信号的高质量重建。//[AS]《WavTokenizer: an Efficient Acoustic Discrete Codec Tokenizer for Audio Language Modeling》 No 44. FFmpeg Sidecar：将独立的FFmpeg二进制文件封装在直观的迭代器接口中，提供极简依赖、自动下载FFmpeg CLI（如需要）、支持Windows、MacOS和Linux，以及彻底的单元测试 No 45. TAG-Bench：AI与数据库的统一范式，用于回答数据库上的自然语言问题，通过Table-Augmented Generation（TAG）模型，探索语言模型与数据库之间的广泛交互，提供首个基准测试研究TAG问题，并验证标准方法在此类查询上的挑战性 No 46. Awesome-LVLM-Attack：针对大型视觉语言模型攻击的全面资源库，收录了相关论文、方法和资源，是研究和了解LVLMs安全威胁的重要参考 No 47. Surya：多语言文档OCR工具包，可进行准确的文本行检测，即将推出文本识别功能，以及表格和图表检测功能，可以处理各种类型的文档和多种语言 No 48. ComfyUI-DeepFuze：集成ComfyUI的先进深度学习工具，提供人脸变换、唇形同步、人脸交换、唇形翻译、视频生成和声音克隆功能，适用于内容创作者、动画师、开发者等，使用户能够通过AI驱动的特性提升视频编辑项目的质量 No 49. 多智能体客户服务系统实现，通过分离的Agent来完成复杂的任务，如用户认证、查询股票价格、查询账户余额和转账等 No 50. [CL]《Scaling Law with Learning Rate Annealing》

Sep 03 '24 15:09 fly51fly