검색 결과

소스

분류

정렬

"performance" · 6개 기사 · AI/ML

DeepSeek V4—거의 최전선에 도달

DeepSeek V4—almost on the frontier

DeepSeek V4가 최신 모델 경쟁선에 거의 도달했다는 평가. 성능 격차 축소와 프런티어 모델 경쟁 심화가 핵심.

AI는 둔화되고 있다

AI is slowing down

AI 발전 속도 둔화 가능성을 다룬 글. 최근 성능 개선과 산업 내 기대가 예전만 못하다는 관측을 제시.

표준 GPU에서 실시간 LLM 추론: 요청당 3k tokens/s

Real-time LLM Inference on Standard GPUs: 3k tokens/s per request

표준 GPU로도 실시간 LLM 추론을 고속 처리하는 방법을 제시. 요청당 초당 3천 토큰 수준의 처리 성능이 핵심.

GLM 5.2 성능 벤치마크

GLM 5.2 Performance Benchmarks

GLM 5.2의 성능 벤치마크를 정리한 글. 여러 기준에서 최신 모델의 역량을 비교해 확인함.

첫 원리로 보는 Deep Learning 가속화하기

Making Deep Learning Go Brrrr from First Principles (2022)

딥러닝 학습과 추론을 더 빠르게 만드는 핵심 원리를 처음부터 설명한 글. 메모리, 연산, 병렬화 관점에서 성능 병목을 풀어낸다.

Leipzig의 벤치마크

Benchmarks in Leipzig

Leipzig를 주제로 한 벤치마크 연구를 다룬 논문. 평가 방법과 성능 비교를 중심으로 한 분석 성격의 작업으로 보임.