爱可可微博热门分享(11.11)
No 1. PDFMathTranslate:一款PDF科学论文翻译和双语对比工具,能保留原文排版,支持全文双语翻译,并且兼容多种翻译服务 No 2. AI入门指南:针对 AI 和大型语言模型(LLM)的中文入门指南,提供了从 API 调用到本地模型部署和微调的教程和演示代码,并且提供了无需显卡即可学习的在线平台链接,同时还包含了李宏毅 2024 年生成式人工智能导论课程的完整中文镜像作业 No 3. 音乐解析器:将音乐转换为五线谱的程序,通过傅里叶变换和信封匹配分离音乐中的各个音符和乐器,实现音乐到乐谱的转换 No 4. LLM Prompt Tuning Playbook:一本教你如何高效“提示”训练后的大型语言模型(LLM)的手册,主要功能是提供心智模型和具体指导,帮你更好地与LLM互动 No 5. Scrapling:一个为Python设计的超快速、自适应的网页抓取工具,能够自动适应网站变化,显著提高网页抓取性能 No 6. Chonkie:专注于文本分块的 Python 库,旨在为 RAG(Retrieval-Augmented Generation)应用提供简单、高效的解决方案。它以其轻量级、高速和广泛的支持而受到推崇,同时提供了多种分块器以满足不同的需求 No 7. VideoChat:实时语音交互的数字人平台,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG),可以自定义数字人的形象和音色,支持音色克隆,并且首包延迟可以低至 3 秒 No 8. Llama3.2-Vision-Finetune:开源项目,专为Meta的Llama3.2-Vision系列模型提供微调功能,支持8位高效训练和Liger-Kernel No 9. Promptwright:一个用本地大型语言模型生成合成数据的Python库,提供灵活易用的接口,帮助用户创建由提示引导的数据集 No 10. Visprex:一款无需发送数据即可快速可视化CSV文件的工具,主打数据安全和便捷性 No 11. #转发赠书#携手@博文视点Broadview 送出3本《具身智能机器人系统》 No 12. 免费讲义《数学基础》 No 13. TI-32:一款为TI-84计算器设计的改装工具,能将其变成作弊设备,具有 Gemini API支持、分页响应支持和回复GPT的功能 No 14. [IR]《Best Practices for Distilling Large Language Models into BERT for Web Search Ranking》 No 15. #抽奖# 携手@图灵文化 @图灵新知 送出3本《MySQL必知必会(第2版)》 No 16. AdvancedLivePortrait-WebUI:基于Gradio的Web界面,让你能轻松编辑图片中的人脸表情,体验AI技术带来的便捷与乐趣 No 17. IronCalc:新一代现代电子表格引擎,用于多样化环境中处理电子表格数据,支持多种编程语言集成,旨在构建不同界面如终端、桌面应用或网页应用 No 18. VLA-3D数据集:一个为视觉语言导航任务设计的3D对象参照数据集,包含超过9百万条为7635个3D场景合成生成的语言描述,适用于视觉语言定位和导航任务 No 19. Voice-Pro:基于 Gradio 的 WebUI,支持 Whisper、faster-Whisper、whisper-timestamped,具备 YouTube 下载器、声音分离器、转录、文本到语音(TTS)和翻译功能 No 20. [CL]《Mixture-of-Transformers: A Sparse and Scalable Architecture for Multi-Modal Foundation Models》 No 21. Modus:开源无服务器框架,用于构建由 WebAssembly 驱动的智能函数和 API,它简化了集成人工智能模型、数据和业务逻辑的过程,并提供了隔离执行环境 No 22. DeepCompressor:大型语言模型和扩散模型的模型压缩工具箱,支持8bit以内的任何整数和浮点数据类型的假量化,例如INT8、INT4和FP4_E2M1,具有高效压缩和加速模型推理的特点 No 23. Intentrace:一款增强版的系统调用跟踪工具,帮助用户全面追踪并理解程序执行过程中的系统调用,特别适合程序员调试程序 No 24. ComfyUI Slider Sidebar:为 ComfyUI 定制的侧边栏插件,旨在通过提供一个用户友好的界面来优化 LoRA 滑块(LECO)的使用体验,使用户能够轻松地访问、导航和使用超过 100 个 LECO LoRAs No 25. Protenix:基于PyTorch的AlphaFold 3可训练复现,专注于蛋白质结构预测,以其高性能和开源特色助力科学研究 No 26. ComfyUI InstantIR Wrapper:一款在ComfyUI中快速提升图片质量的工具,能够修复模糊照片,实现即时图像恢复 No 27. TkEasyGUI:Python最简单的GUI库,让你轻松创建图形用户界面,无需深入了解Tkinter No 28. Kiroku:多智能体系统,帮你组织和撰写文档,就像有一个智能助手团队帮你从构思到成文 No 29. Jaws:一个将JavaScript代码转换成WebAssembly的编译器,旨在实现无需解释器即可执行的独立WASM二进制文件,支持现代WASM特性 No 30. Web Archive:基于Cloudflare的免费网页归档和分享工具,能够保存网页为单个html文件并上传至服务器,方便用户存储和查看网页快照,提供浏览器插件、服务器端和网页客户端,支持网页归档、分享和搜索功能 No 31. 早![太阳] No 32. [LG]《Constrained Diffusion Implicit Models》 No 33. ComfyUI-GIMM-VFI:一款用户界面工具,用于实现视频帧插值技术,提升视频流畅度 No 34. Twitter到Bluesky迁移工具:一键将你的Twitter数据导入Bluesky平台,支持过滤和自定义导入,让你的社交媒体内容轻松转移 No 35. [AS]《Music Foundation Model as Generic Booster for Music Downstream Tasks》 No 36. 晚安~ [月亮] No 37. AI求职助手:2025 年 AI/ML 领域的实习和新毕业生职位列表,提供了包括Meta、Google、Amazon等公司的最新职位信息,以及相关的薪资和申请链接 No 38. solidtime - 现代开源时间追踪应用:专为自由职业者和代理机构设计,提供时间跟踪、项目管理、任务分配等多功能的现代界面 No 39. Mixamo动画转OpenPose序列:一个能将Mixamo动画直接转换成OpenPose图像序列的工具,用于AI图像生成或数据集创建,特色是操作简单,支持动画旋转和缩放 No 40. 数据科学家手册:为数据科学爱好者提供的学习资源库,包含从入门到进阶的各类免费和付费资源,助力数据科学家学习成长和职业发展 No 41. Offmute:智能会议记录与分析工具,能够将音视频内容转换为文本,同时识别不同发言人,生成结构化会议报告 No 42. [TAI快报]多模态模型与数学新突破 No 43. mochi-xdit:视频生成模型的加速并行推理工具,让视频生成更快更高效,特别适用于需要大规模视频生成的场景 No 44. Twilio语音助手:通过Twilio语音服务和OpenAI实时API,实现电话中与AI助手对话的应用,特色在于双向语音交流和AI优先发言功能 No 45. 本文提出了一种新的知识蒸馏框架 DisRanker,通过结合持续预训练和混合损失函数,将大型语言模型的排名能力高效地迁移到 BERT 模型,显著提升了网页搜索排名的效果,并在实际应用中取得了成功。//[IR]《Best Practices for Distilling Large Language Models into BERT for Web Search Ranking》 No 46. TutoriaLLM:面向中小学生的自托管编程学习平台,由LLM提供,旨在帮助教育者创建和学生学习编程教育内容 No 47. [LG]《Distributionally Robust Optimization》 No 48. [LG]《LoRA vs Full Fine-tuning: An Illusion of Equivalence》 No 49. reCamera:开源相机平台,集成处理器和摄像头传感器,用于基本检测和控制任务,特点是模块化、高性能和易用性 No 50. Kube Startup CPU Boost:一个在Kubernetes工作负载启动时增加CPU资源请求和限制的控制器,特别适合启动阶段需要额外CPU资源的应用,如基于JVM的应用