HTTP/2 200
server: GitHub.com
content-type: text/html; charset=utf-8
last-modified: Fri, 21 Mar 2025 15:17:04 GMT
access-control-allow-origin: *
strict-transport-security: max-age=31556952
etag: W/"67dd82f0-6bac"
expires: Mon, 26 Jan 2026 18:09:39 GMT
cache-control: max-age=600
content-encoding: gzip
x-proxy-cache: MISS
x-github-request-id: 4056:362614:6776E:743EC:6977AB8A
accept-ranges: bytes
age: 0
date: Mon, 26 Jan 2026 17:59:39 GMT
via: 1.1 varnish
x-served-by: cache-bom-vanm7210028-BOM
x-cache: MISS
x-cache-hits: 0
x-timer: S1769450379.138630,VS0,VE236
vary: Accept-Encoding
x-fastly-request-id: 9101130484835b01c4de919b60cd0158d41cd245
content-length: 6230
erberry的个人博客 | 知识分享
The great end of life is not knowledge, but action.
深入解析大模型的显卡需求 - 为什么需要多张显卡?探索大模型背并行运算技术
技术
transformer
并行计算
阅读全文
DeepSeek-V3是一个拥有6710亿参数的大型语言模型,采用混合专家系统(MoE)架构设计。本文将分析该模型在推理过程中的显存需求,基于官方推理代码和配置文件进行计算。模型使用fp8数据类型,每个参数占1字节。
技术
DeepSeek
transformer
阅读全文
随着大语言模型(LLM)的飞速发展,越来越多的研究者开始探索如何提升模型的推理能力、响应一致性和可读性。最近,DeepSeek-R1作为一种全新的AI模型在这一领域引起了广泛关注。今天,我们就来深入了解DeepSeek-R1及其创新的训练方法。
技术
DeepSeek-R1
阅读全文
Redis Cluster是Redis的分布式实现,通过分片(Sharding)将数据分散到多个节点上,实现水平扩展。 它不仅提供了数据分片能力,还支持高可用性和在线数据迁移,使得集群可以在不停机的情况下进行扩容和缩容
技术
redis
阅读全文
Redis Cluster作为一种分布式解决方案,在提供高可用性的同时,也面临着数据一致性的挑战。本文将深入分析Redis Cluster在异常情况下的数据安全性问题,特别是在网络分区和主备切换场景下可能出现的数据丢失风险,并提供相应的解决方案。
技术
redis
阅读全文