검색 결과
"performance" · 55개 기사 · Dev/Tools
HTML-first 사이트 구축으로 사용자 수가 하룻밤 사이 두 배로 증가
Building an HTML-first site doubled our users overnight
사이트 구조를 HTML 우선으로 바꾼 뒤 사용자 수가 즉시 두 배로 늘었다는 사례. 웹 기본 구조와 성능 최적화가 성장에 직접 영향을 줌.
Microsoft 새 Outlook은 Outlook Classic이 즉시 하는 일을 10초 걸려 처리한다
Microsoft new Outlook takes 10 seconds to do what Outlook Classic does instantly
새 Outlook이 기존 Outlook Classic보다 체감 성능이 크게 떨어진다는 불만을 다룬 글. Windows 환경에서의 반응 속도 저하와 사용성 차이가 핵심 쟁점.
모든 프레임을 완벽하게
Every Frame Perfect
프레임 단위의 렌더링과 화면 갱신을 정밀하게 다루는 글. 애니메이션과 UI에서 끊김 없는 표현을 강조함.
Dav2d
Dav2d
Dav2d를 다룬 기술 글. 디코딩 구현과 성능 특성을 중심으로 소개됨.
Spinel: Ruby AOT 네이티브 컴파일러
Spinel: Ruby AOT Native Compiler
Ruby 코드를 AOT 방식으로 네이티브 코드에 컴파일하는 Spinel이 공개됨. Ruby 성능 개선과 런타임 의존성 축소를 노린 도구.
Claude Desktop이 실행할 때마다 1.8GB Hyper-V VM을 띄우는 문제, 채팅 전용 사용에서도 발생
Claude Desktop spawns 1.8 GB Hyper-V VM on every launch, even for chat-only use
Claude Desktop이 실행될 때마다 1.8GB Hyper-V VM을 생성한다는 이슈가 제기됨. 채팅 전용 사용에서도 동일한 오버헤드가 발생함.
스키플리스트(Skiplists)는 어디에 유용한가?
What are skiplists good for?
스키플리스트의 구조적 특징과 효율적인 데이터 검색 및 삽입 성능을 분석합니다. 특정 상황에서 왜 스키플리스트가 다른 자료구조보다 유리한지 기술적인 관점에서 설명합니다.
Mojo 1.0 베타
Mojo 1.0 Beta
Mojo가 1.0 베타 단계에 들어섬. 고성능 컴퓨팅과 Python 생태계 연계를 겨냥한 언어 개발 흐름이 이어짐.
Pokemon Emerald를 WebAssembly로 포팅, 100k FPS 달성
Pokemon Emerald Ported to WebAssembly (100k FPS)
Pokemon Emerald를 WebAssembly로 포팅해 매우 높은 실행 속도인 100k FPS를 구현함. 웹 환경에서 고성능 에뮬레이션과 바이너리 포팅 가능성을 보여줌.
Every Byte Matters
Every Byte Matters
코드와 데이터에서 바이트 단위 최적화의 중요성을 다룬 글. 저장공간과 전송비용을 줄이는 세부 절약 기법을 정리.
macOS VM은 얼마나 빠르고, 얼마나 작게 만들 수 있을까?
How fast is a macOS VM, and how small could it be?
macOS 가상 머신의 성능과 최소 구성 가능 크기를 실험한 글. Apple 가상화 환경의 효율성과 경량화 한계를 다룸.
이진 탐색은 더 빨리 이길 수 있다
You can beat the binary search
이진 탐색보다 더 빠른 탐색 기법이 가능하다는 분석을 제시함. 자료 구조와 분기 예측, 메모리 접근 비용 관점의 최적화를 다룸.
Python 3.14와 3.15의 incremental GC 되돌리기
Reverting the incremental GC in Python 3.14 and 3.15
Python의 incremental GC 변경을 되돌리는 논의가 진행 중. 성능과 안정성 사이의 트레이드오프가 쟁점으로 부상함.
Branchless Quicksort, std::sort와 pdqsort보다 빠른 C 및 C++ API
Branchless Quicksort faster than std:sort and pdqsort with C and C++ API
브랜치 제거 기법을 적용한 Quicksort 구현이 std::sort와 pdqsort보다 빠른 성능을 보임. C와 C++ API를 함께 제공하며 벤치마크 결과를 제시함.
Linear는 왜 이렇게 빠른가? 기술적 분석
How's Linear so fast? A technical breakdown
Linear의 빠른 반응성과 성능을 기술적으로 해부한 글. 제품 속도를 만드는 아키텍처와 최적화 포인트를 다룸.
빠른 동적 언어 인터프리터 만드는 법
How to make a fast dynamic language interpreter
동적 언어 인터프리터를 빠르게 구현하는 설계 원칙과 최적화 기법을 설명한 글. 파싱, 실행 경로, 런타임 성능 개선에 초점을 맞춤.
훌륭한 abstraction의 숨은 비용
The 'Hidden' Costs of Great Abstractions
추상화가 개발 생산성을 높이는 동시에 복잡성, 디버깅 비용, 성능 손실을 숨길 수 있음을 지적. 설계 수준에서의 대가를 다시 보자는 논점.
Restartable Sequences
Restartable Sequences
리눅스의 restartable sequences(rseq) 메커니즘을 설명하는 시스템 프로그래밍 글. 저지연 경로와 성능 최적화에 초점이 맞춰짐.
SQLite에서 UUID 기본 키의 위험성
The perils of UUID primary keys in SQLite
SQLite에서 UUID를 기본 키로 쓰면 저장 효율과 인덱스 성능에 불리할 수 있다는 분석. 정렬 불연속성과 비효율적 페이지 사용이 주요 문제로 지목됨.
현대 렌더링 컬링 기법
Modern Rendering Culling Techniques
렌더링 파이프라인에서 보이지 않는 오브젝트를 줄이기 위한 최신 컬링 기법을 정리한 글. CPU와 GPU 부하를 낮춰 프레임 성능을 높이는 접근을 다룬다.
Show HN: Tiny-vLLM – C++와 CUDA 기반 고성능 LLM 추론 엔진
Show HN: Tiny-vLLM – high performance LLM inference engine in C++ and CUDA
C++와 CUDA로 구현한 Tiny-vLLM이 소개됨. LLM 추론 성능을 높이기 위한 경량 엔진을 목표로 함.
예측 가능한 데이터가 주어지면 GPU의 Matrix Multiplications가 더 빨라진다 (2024)
Matrix Multiplications on GPUs Run Faster When Given "Predictable" Data (2024)
GPU 행렬곱이 예측 가능한 입력 데이터에서 더 빠르게 동작할 수 있다는 관찰을 다룸. 메모리 접근과 하드웨어 최적화 관점의 성능 차이가 핵심.
WSL 2의 Windows 파일 시스템 접근 속도 개선
WSL 2 is getting faster Windows file system access
WSL 2에서 Windows 파일 시스템 접근 성능을 높이는 변경 사항을 다룸. Virtiofs와 관련된 최적화로 파일 I/O 지연을 줄이는 흐름.
Ruby 경로(Path) 메서드 최적화
Optimizing Ruby Path Methods
Ruby 언어에서 파일 경로 처리 메서드의 성능을 개선하기 위한 기술적 접근 방식을 다룹니다. 내부 구현을 분석하여 실행 속도를 높이고 효율적인 코드를 작성하는 방법을 제시합니다.
Clojure: Transducers
Clojure: Transducers
Clojure의 transducers 개념을 설명하는 기술 문서. 컬렉션 처리에서 함수 합성과 성능 최적화를 다룸.
Rust를 위한 Zero-copy protobuf와 ConnectRPC
Zero-copy protobuf and ConnectRPC for Rust
Rust에서 zero-copy protobuf와 ConnectRPC를 적용하는 방법을 다룬 글. 직렬화 비용과 메모리 복사를 줄여 성능과 효율을 높이는 데 초점.
생물학에서 아이디어를 빌려 Haskell 컴파일을 더 빠르게
Stealing from Biologists to Compile Haskell Faster
생물학적 원리를 힌트로 삼아 Haskell 컴파일 속도를 개선하는 방법을 다룬 글. 컴파일러 최적화와 언어 구현 성능에 초점이 맞춰짐.
FPS 카운터 구현 방법
How to Implement an FPS Counter
FPS 카운터를 구현하는 방법을 설명한 기술 글. 프레임 측정과 화면 표시 로직을 다루는 개발 가이드다.
Rust 언어의 성능 [pdf
Performance of Rust Language [pdf]
] Rust 언어의 성능 특성을 다룬 발표 자료. 실행 효율과 메모리 안전성의 균형을 중심으로 설명함.
C++26에 아무도 원하지 않은 SIMD 라이브러리가 포함됨
C++26 Shipped a SIMD Library Nobody Asked For
C++26 표준에 SIMD 라이브러리가 포함된 배경과 의의를 비판적으로 조명. 언어 표준과 성능 최적화의 균형을 다룸.
High Performance Git
High Performance Git
Git 성능을 높이기 위한 실전 기법과 최적화 방법을 다룬다. 대형 저장소에서의 속도 개선이 핵심 주제다.
Zig Structs of Arrays (2024)
Zig Structs of Arrays (2024)
Zig에서 Structs of Arrays 패턴을 구현하는 방법을 정리한 글. 메모리 배치와 성능 최적화 관점의 자료구조 설계가 핵심.
ast.walk를 220배 더 빠르게 만들기
Making ast.walk 220x Faster
Python AST 순회 성능을 220배 끌어올린 최적화 사례. 정적 분석과 코드 처리 도구의 병목 개선 포인트를 다룸.
정수를 10진수 문자열로 2나노초 이내에 변환하기
Converting an Integer to a Decimal String in Under Two Nanoseconds
정수를 10진수 문자열로 바꾸는 초고속 변환 기법을 다룬 연구. 2나노초 미만 지연을 목표로 문자열 변환 경로를 최적화함.
느린 터미널은 인생이 너무 짧다
Life is too short for a slow terminal
느린 터미널이 개발 흐름과 생산성을 크게 떨어뜨린다는 문제의식. 빠른 CLI 환경과 터미널 최적화의 가치를 강조함.
async가 약속한 것과 실제로 제공한 것
What async promised and what it delivered
비동기(async)가 기대받았던 생산성 향상과 실제 구현 결과를 비교. 복잡성 증가와 운영상의 제약도 함께 짚음.
GoScrapy - Go 기반 초고속 웹 스크래핑 프레임워크
GoScrapy - Go기반 초고속 웹 스크래핑 프레임워크
Python Scrapy 구조를 Go로 네이티브 구현한 고성능 웹 스크래핑 프레임워크. 빠른 성능과 간단한 프로젝트 생성 명령을 강조.
TypeScript 7.0 Beta 공개
TypeScript 7.0 Beta 공개
TypeScript 7.0 Beta가 공개됐고, Go 네이티브 포팅으로 기존 컴파일러 대비 약 10배 빠른 성능을 내세움. 일상 개발에 바로 쓰는 수준의 베타로 소개.
Smol machines – 1초 미만 콜드스타트 및 포터블한 가상머신
Smol machines – 1초 미만 콜드스타트 및 포터블 한 가상머신
smolvm은 macOS와 Linux 환경에서 1초 미만의 빠른 콜드스타트를 지원하는 경량 가상머신 관리 도구입니다. 단일 파일 이식성과 효율적인 메모리 관리를 통해 격리된 환경에서 소프트웨어를 신속하게 실행할 수 있습니다.
cargo-chronoscope - Cargo 빌드 성능 옵저버 (TUI + GitHub Action)
Show GN: cargo-chronoscope - Cargo 빌드 성능 옵저버 (TUI + GitHub Action)
Rust 프로젝트의 cargo build 성능 저하를 PR 단위로 추적하는 도구 소개. TUI와 GitHub Action으로 빌드 시간 증가 원인을 찾도록 설계됨.
Show GN: Flutist: Flutter Modular Architecture 관리 프레임워크를 만들어봤습니다! (feat. Tuist)
Show GN: Flutist : Flutter Modular Architecture 관리 프레임워크를 만들어봤습니다! (feat. Tuist)
Flutter 프로젝트의 모듈 수가 늘어날 때 빌드 성능과 레이어 격리를 관리하기 위한 프레임워크를 소개. Tuist를 활용해 구조화된 모듈 아키텍처 운영 방식을 제안.
x86 에뮬레이터 팀이 너무 나쁜 코드를 발견해 에뮬레이션 중 고쳐버린 일
x86 에뮬레이터 팀이 너무 나쁜 코드를 발견해 에뮬레이션 중 고쳐버린 일
x86-32 에뮬레이터가 바이너리 변환으로 네이티브 코드를 생성하는 과정에서 비정상적으로 나쁜 코드를 발견함. 에뮬레이션 중 해당 코드를 수정해 성능과 안정성을 확보한 사례.
HTML 우선 사이트를 구축해 하룻밤 사이 사용자를 두 배로 늘린 방법
HTML 우선 사이트를 구축해 하룻밤 사이 사용자를 두 배로 늘린 방법
자바스크립트 없이도 동작하는 HTML 우선 설계로 공공 서비스 신청 흐름을 단순화했다. 열악한 기기와 네트워크에서도 접근성과 완료율을 개선해 기존 React 앱을 대체했다.
빠른 터미널에 대해 내가 틀렸던 것
빠른 터미널에 대해 내가 틀렸던 것
빠른 셸은 최소 설정만으로 완성되지 않으며, 실제 체감은 첫 프롬프트, 첫 명령 실행, 입력 지연에서 결정된다는 점을 짚음. Zsh 초기화 시간을 단순 측정하는 것만으로는 사용 경험을 제대로 설명할 수 없다고 정리함.
Linear는 어떻게 이렇게 빠른가? 기술적 분석
Linear는 어떻게 이렇게 빠른가? 기술적 분석
Linear는 IndexedDB 기반 로컬 우선 동기화로 변경을 먼저 반영하고 서버로 비동기 전송함. 브라우저 내 데이터베이스와 WebSocket 동기화로 수 밀리초 수준의 빠른 UI 반응을 구현함.
SQLite에서 UUID 기본 키의 위험성
SQLite에서 UUID 기본 키의 위험성
SQLite에서 랜덤 UUID4를 기본 키로 쓰면 B-tree 재균형과 추가 페이징 비용이 커져 성능이 떨어질 수 있음. rowid 기반 테이블과 WITHOUT ROWID 테이블의 물리 저장 특성 차이도 함께 짚음.
fork() + exec()를 넘어선 프로세스 생성
fork() + exec()를 넘어
Linux 커널에 spawn templates를 도입해 반복 실행되는 같은 실행 파일의 시작 비용을 줄이려는 제안. 실행 파일 정보를 캐시해 fork()+exec()보다 빠른 프로세스 생성을 노림.
jj v0.42.0 릴리스 - Git 호환 버전 관리 시스템
jj v0.42.0 릴리스 - Git 호환 버전 관리 시스템
mimalloc 메모리 할당자로 전환해 멀티스레드 성능을 개선함. commit/describe 관련 일부 폐기 예정 명령 옵션을 제거하고 동작 정리를 진행함.
QBE - 컴파일러 백엔드: 버전 1.3
QBE - 컴파일러 백엔드: 버전 1.3
QBE 1.3이 성능 최적화를 크게 강화한 주요 릴리스로 공개됨. vanillacoremark에서 상용 컴파일러 성능의 63% 이상을 기록했고 Hare 테스트 스위트에서는 1.2 대비 33% 개선됐다.
Rust로 구현한 Zstandard 발표
Rust로 구현한 Zstandard 발표
Trifecta 재단이 zstd의 첫 Rust 기반 릴리스를 공개함. gzip보다 빠르고 압축률이 높아 웹 트래픽 압축의 대안으로 확산될 가능성이 큼.
React를 좋아하는 사람이 실제로 있긴 한가요?
React를 좋아하는 사람이 실제로 있긴 한가요?
React와 React 계열 도구를 비판하는 글들을 모아 정리한 큐레이션. 성능 저하, 복잡도 증가, 하이드레이션 문제 등 구조적 한계가 반복적으로 지적됨.
Utilyze - GPU가 실제로 유용한 작업을 얼마나 효율적으로 수행하는지 측정하는 도구
Utilyze - GPU가 실제로 유용한 작업을 얼마나 효율적으로 수행하는지 측정하는 도구
nvidia-smi와 nvtop은 커널 실행 여부만 보여 실제 자원 사용량을 과대평가할 수 있음. Utilyze는 GPU 성능 카운터를 직접 읽어 실질적 사용량을 라이브로 측정함.
asm.js에 작별을 고하기
asm.js에 작별을 고하기
Firefox 148부터 SpiderMonkey의 asm.js 최적화가 기본 비활성화됨. 기존 asm.js 콘텐츠는 계속 동작하지만 일반 JIT 경로로 실행돼 최적화 이점은 사라짐.
Python 3.15 신규 샘플링 프로파일러 Tachyon 소개
Python 3.15 신규 샘플링 프로파일러 Tachyon 소개
Python 3.15에 추가되는 샘플링 프로파일러 Tachyon으로 멀티스레딩 병목과 추상화 비용을 시각화한 사례가 소개됨. GIL-free 환경을 포함한 새 실행 모델에서 성능 분석 도구의 필요성이 강조됨.
JavaScript 디블로팅
JavaScript 디블로팅
JavaScript의 중첩 구조와 라이브러리 의존이 작은 UI도 쉽게 비대해지게 만든다는 문제를 다룸. WebAssembly와 Pyodide 같은 대안도 있지만, 브라우저 이벤트 루프와의 연결 비용이 여전히 부담으로 지적됨.