검색 결과

"performance" · 6개 기사 · AI/ML

1
해커뉴스AI/ML4552942026-05-02

DeepSeek V4—거의 최전선에 도달

DeepSeek V4—almost on the frontier

DeepSeek V4가 최신 모델 경쟁선에 거의 도달했다는 평가. 성능 격차 축소와 프런티어 모델 경쟁 심화가 핵심.

2
해커뉴스AI/ML2653052026-06-08

AI는 둔화되고 있다

AI is slowing down

AI 발전 속도 둔화 가능성을 다룬 글. 최근 성능 개선과 산업 내 기대가 예전만 못하다는 관측을 제시.

3
해커뉴스AI/ML189882026-05-29

표준 GPU에서 실시간 LLM 추론: 요청당 3k tokens/s

Real-time LLM Inference on Standard GPUs: 3k tokens/s per request

표준 GPU로도 실시간 LLM 추론을 고속 처리하는 방법을 제시. 요청당 초당 3천 토큰 수준의 처리 성능이 핵심.

4
해커뉴스AI/ML134422026-06-17

GLM 5.2 성능 벤치마크

GLM 5.2 Performance Benchmarks

GLM 5.2의 성능 벤치마크를 정리한 글. 여러 기준에서 최신 모델의 역량을 비교해 확인함.

5
해커뉴스AI/ML132492026-05-23

첫 원리로 보는 Deep Learning 가속화하기

Making Deep Learning Go Brrrr from First Principles (2022)

딥러닝 학습과 추론을 더 빠르게 만드는 핵심 원리를 처음부터 설명한 글. 메모리, 연산, 병렬화 관점에서 성능 병목을 풀어낸다.

6
해커뉴스AI/ML114422026-06-06

Leipzig의 벤치마크

Benchmarks in Leipzig

Leipzig를 주제로 한 벤치마크 연구를 다룬 논문. 평가 방법과 성능 비교를 중심으로 한 분석 성격의 작업으로 보임.