Tag Archive: DeepSeek

DeepSeek는 어떻게 저성능 Nvidia를 고성능으로 바꾸었을까

1. DeepSeek가 저성능 GPU를 고성능 GPU로 바꾼 비밀이 무엇일까? 궁금했는데 이와 관련한 제목이 보였습니다. DeepSeek’s AI breakthrough bypasses industry-standard CUDA for some functions, uses Nvidia’s assembly-like PTX programming instead 무언가 대단한 내용이 있을 것으로 기대하고 읽었는데 출처가 의외였습니다. 미래에셋증권의 AI보고서 AI Weekly #45 2025년 ‘AI 혁신은 계속되고 가속된다’중 일부입니다. PTX가 무엇인지 알아보죠. 우선 Nvidia의 CUDA 공식문서에 있는 내용입니다. 1.1. Scalable Data-Parallel…
Read more

DeepSeek AI 모델에 대한 여러가지 이해

1. DeepSeek와 관련한 글을 읽으면서 이해도가 무척 떨어집니다. AI 기술에 대한 이해도 낮고 Nvidia GPU에 대한 이해도 낮습니다. 그래서 A100과 H800이 무엇인지, 어떻게 다른지도 잘 모릅니다. 엔비디아 AI 칩: A100 A800 H100 H800 B200에 올라온 비교표로 이해를 높혔습니다.우선…. Dropbox 부사장 Morgan Brown이 쓴 Why DeepSeek’s AI Breakthrough May Be the Most Crucial One Yet. linkedin에 올린 글입니다. AI Product 담담…
Read more

DeepSeek, Fire-Flyer 그리고 High-Flyer

1. DeepSeek. 페북에 올라오는 AI글중 최근에 부쩍 deepseek에 대한 언급이 많았습니다. 그냥 수많은 회사중 하나라고 생각했습니다. 그런데 뜻밖의 이야기를 보았습니다. 김성완님의 글입니다. 놀라운 성능으로 세상을 놀라게 한 DeepSeek-V3와 DeepSeek-R1은 중국의 신생 AI 기업 DeepSeek가 미국이나 중국의 빅 테크에 비해서 훨씬 저렴한 비용과 낮은 성능의 GPU로 해낸 일이라서 많은 관심을 불러일으켰습니다. 그런데 이 놀라운 결과가 중국의 한 퀀트 회사의 사이드 프로젝트에서…
Read more