Skip to content

AI技术

人工智能和机器学习技术

21 篇文章 93 个标签

缓存策略:命中率、时效与一致性

缓存策略:命中率、时效与一致性(工程视角)

参数规模、数据质量与效果:工程视角的取舍

参数规模、数据质量与效果:工程视角的取舍(工程视角)

LLM 全景与发展脉络:能力边界与适用边界

LLM 全景与发展脉络:能力边界与适用边界(工程视角)

大模型应用开发指南 - RAG与Agent技术实践

如果说大模型是"大脑",那么RAG和Agent就是让这个"大脑"能够感知世界、获取知识、执行任务的"手脚"。作为一个深度参与大模型应用开发的架构师,我见证了从简单的问答系统到复杂的智能助手的演进过程。

大模型监控与运维 - 生产环境稳定性保障

如果说部署大模型是"上线",那么监控运维就是"守护"。作为一个深度参与大模型生产运维的SRE工程师,我见证了从"能跑就行"到"稳定可靠"的运维体系演进过程。

大模型成本优化实战 - 降本增效的工程实践

如果说大模型的能力让人惊叹,那么大模型的成本就让人"肉疼"。作为一个深度参与大模型商业化的技术负责人,我见证了从"不计成本追求效果"到"精打细算降本增效"的转变过程。

大模型部署架构设计 - 高并发推理服务构建

如果说训练大模型是"炼丹",推理优化是"炼器",那么部署架构设计就是"排兵布阵"。作为一个深度参与大模型生产部署的架构师,我见证了从单机部署到分布式集群,从简单API到复杂微服务架构的演进过程。

多模态大模型技术 - 视觉语言模型的技术突破

如果说单模态大模型让AI学会了"说话",那么多模态大模型就让AI学会了"看世界"。作为一个见证了从纯文本模型到多模态模型发展的研究者,我深深感受到这一技术突破的革命性意义。

大模型安全与对齐 - RLHF技术原理与实践

如果说大模型的能力让人惊叹,那么如何让这种能力安全可控就是一个更加复杂的挑战。作为一个深度参与AI安全研究的工程师,我见证了从"能用"到"好用"再到"安全用"的技术演进。

推理优化技术全解 - 从模型压缩到硬件加速

如果说训练大模型是"炼丹",那么推理优化就是"炼器"。一个训练好的大模型要真正发挥价值,必须能够快速、高效地为用户提供服务。作为一个深度参与大模型推理优化的工程师,我见证了从单纯追求模型效果到平衡效果与效率的技术演进。

大模型训练技术详解 - 分布式训练与优化策略

训练一个大模型就像指挥一支千人交响乐团,每个"乐手"(GPU)都要在正确的时间演奏正确的"音符"(计算),最终合奏出美妙的"乐章"(智能模型)。作为一个深度参与大模型训练的工程师,我见证了从单卡训练到万卡集群的技术演进。

开源vs闭源大模型对比 - 技术路线与商业模式分析

2023年是大模型的分水岭之年。一边是OpenAI的GPT-4继续领跑,另一边是Meta的LLaMA掀起开源浪潮。作为一个深度参与开源和闭源项目的技术人员,我见证了这场"开源vs闭源"大战的全过程。