爱可可微博热门分享(7.1)
No 1. 《大厂AI实践》 No 2. 程序员的大脑:旨在通过认知科学的角度,教授程序员如何更高效地学习和思考代码,提升编程技能 No 3. 什么是Agent No 4. MIT机器人专家Rodney Brooks认为人们严重高估了生成式AI No 5. 网球分析助手:基于YOLO和CNN的网球视频分析工具,可测量球员速度、击球速度和击球次数,适用于提升机器学习和计算机视觉技能 No 6. StableFace:基于 Stable Diff... No 7. 有人完全用Stable Diffusion制作的漫画:用SD1.5完成,model为iComix,在提示中混合著名演员以保持人脸一致,用ControlNet Reference实现服装一致,用ControlNet OpenPose控制姿态 No 8. 关于 WiFi 信道状态信息(CSI)感知技术的精... No 9. RAG检索用嵌入模型微调:针对特定领域数据优化的嵌入模型,显著提升检索性能,适用于金融领域的RAG应用 No 10. Free GPT 3.5 API:一个免费的GPT 3.5模型API服务,支持多种授权方式,简化了API接口的调用和部署过程 No 11. gptpdf: 用GPT解析PDF的自动化工具,将PDF内容转换为Markdown格式,支持排版、数学公式、表格、图片和图表的完美解析,每页平均价格0.013美元 No 12. 智谱AI实时语音转文字助手:结合流式大型语言模型和GPT-SOVITS,通过网页实现跨网络服务调用,支持实时对话功能 No 13. Arcee Spark:一款具有 70 亿参数的高性能语言模型,通过从 Qwen2 初始化并采用精细化的训练过程,包括微调、合并和直接偏好优化(DPO),在 MT-Bench 等基准测试中表现出色,在同类模型中获得最高分数,甚至在多项任务上超过了 GPT-3.5 No 14. 实时语音AI助手:快速响应语音查询的智能Agent,能够在大约500毫秒内以语音形式回答问题,具有高度灵活性,支持任意大型语言模型、文本到语音(TTS)和语音到文本(STT)模型的替换使用,适用于客户服务机器人、接待员等多种场景 No 15. Eidolon:开源智能Agent服务框架,简化智能Agent的设计和部署,支持模块化组件定制和升级,无厂商锁定,适应快速变化的AI领域 No 16. GeoSpy:基于AI的地理定位工具,揭示照片拍摄地点,由Graylark提供技术支持,支持Python语言开发 No 17. Bora:生物医学通用视频生成模型,专为文本引导的生物医学视频生成设计,可提高医学教育、机器人辅助手术和医学AI开发的数据增强 No 18. 360LayoutAnalysis:文档版式分析模型和数据集,专注于自动化文档处理和信息提取 No 19. #免费##抽奖# 携手@异步图书 送出3本《Python极客项目编程(第2版)》 No 20. #免费##抽奖# 携手@图灵新知 @图灵文化 送出3本《CPython设计与实现》 No 21. 看图学大模型:以图解形式介绍大型语言模型技术,帮助读者快速理解复杂概念,适合初学者和专业人士 No 22. 几篇论文实现代码 No 23. #抽奖##赠书# 携手@博文视点Broadview 送出3本《高效深度学习:模型压缩与设计(全彩)》 No 24. ScreenPipe:将屏幕内容转化为行动的智能工具,利用大型语言模型(LLM)进行屏幕内容分析与操作,灵感来源于adept.ai、rewind.ai和Apple Shortcut,采用Rust + WASM技术实现 No 25. [CL] Large Language Models Assume People are More Rational than ...... No 26. [CL] LLMs' Classification Performance is Overclaimed 通过移除分类任务中的金标准标签,设计OMNIACCURACY指标,发现当前大语言模型的分类性能被高估,仍存在理解任务本质的局限性。 ...... No 27. 集成实时网页浏览功能的 GPT-4:结合先进语言处理与互联网的实时数据检索,实现高效信息获取,适用于搜索引擎和问答系统 No 28. 通过变分顺序Monte Carlo方法拟合低秩RNN,提出一种从神经数据中推断出可解释低维度动力学模型的有效方案。//[LG]《Inferring stochastic low-rank recurrent neural networks from neural data》 No 29. AI文本到视频模型:从零开始使用Python搭建小型AI视频生成模型,输入文本提示即可生成相应视频,涵盖理论概念理解到架构编码及最终结果生成全过程 No 30. Agentic LLM漏洞扫描器:开源的大型语言模型(LLM)安全扫描工具,提供定制化规则集和基于Agent的攻击测试,全面模糊测试任何LLM,集成LLM API并进行压力测试,支持广泛的模糊测试和攻击技术 No 31. QuPath:Segment Anything Model(SAM)的深度学习模型扩展,用于细胞图像分割,支持稀疏注释训练,提高细胞图像分析的效率 No 32. [LG] SAIL: Self-Improving Efficient Online Alignment of Large ...... No 33. unet.cu:基于纯CUDA的UNet扩散模型,优化图像合成性能,实现与PyTorch相当的训练速度 No 34. portBLAS:基于SYCL开放标准的BLAS实现,为高性能计算提供现代化的C++实现 No 35. Mako: 基于Rust的极速生产级Web打包器,适用于Web应用、混合应用、小程序(部分)、低代码、无服务器等场景 No 36. jing332/tts-server-android:Android系统TTS应用,支持自定义HTTP请求和多种本地TTS引擎,具备中文双引号旁白/对话识别朗读功能,以及自动重试、备用配置和文本替换等高级功能 No 37. 利用多模态大型语言模型进行虚假信息研究的论文列表,为信息/特征提供者、数据生成器和分析器 No 38. Open-Sora: 完全开源的高效复现类Sora视频生成方案,不仅实现了先进视频生成技术的低成本普及,还提供了一个精简且用户友好的方案,简化了视频制作的复杂性 No 39. [CL]《From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models》 No 40. Docker for Robotics:机器人操作系统(ROS/ROS 2)与Docker集成的最佳实践指南,提供Linux和Windows操作系统上的开发建议,涵盖图形用户界面显示、硬件操作、实时代码能力以及多机器网络设置。同时提供Visual Studio Code的容器设置指导 No 41. [RO]《Dreamitate: Real-World Visuomotor Policy Learning via Video Generation》 No 42. 晚安~ [月亮] No 43. 早![太阳] No 44. TexPainter:多视角一致性的生成式网格纹理工具,基于预训练扩散模型的潜空间进行优化,以改善生成纹理的一致性和整体质量 No 45. 用Rust和Ratatui库构建的神经网络学习玩贪吃蛇游戏,支持自定义训练和可视化展示 No 46. cz-blog个人博客系统:基于SpringBoot + Thymeleaf + Vue开发的全栈博客平台,提供自适应的前端界面和后台管理功能,适用于毕设、实习和个人学习项目 No 47. SpeechLLM:多模态语言模型,专为分析和预测对话中说话人环节的元数据而训练,集成了语音编码器,将语音信号转换为有意义的语音表示,结合文本指令由语言模型进行处理以生成预测 No 48. ComfyUI Photoshop插件:集成AI生成功能,提升Photoshop图像编辑体验,支持一键式图像艺术化转换,简化操作流程,增强性能 No 49. Ideogram Upscale:AI驱动的图像增强工具,利用先进细节和逼真度提升每个像素,提高图像分辨率 No 50. [LG]《Efficient Evolutionary Search Over Chemical Space with Large Language Models》