검색 결과

소스

분류

정렬

"llm" · 8개 기사 · Hacker News · Dev/Tools

Ask HN: Claude/GPT를 일상 코딩에서 로컬 모델로 대체한 사람이 있는가

Ask HN: Has anyone replaced Claude/GPT with a local model for daily coding?

HN에서 일상 코딩 워크플로우를 Claude/GPT 대신 로컬 모델로 바꿔 쓸 수 있는지 논의. 속도, 품질, 비용, 프라이버시가 핵심 쟁점.

Show HN: Semble – grep보다 98% 적은 토큰을 쓰는 에이전트용 코드 검색

Show HN: Semble – Code search for agents that uses 98% fewer tokens than grep

에이전트가 쓰기 좋은 저토큰 코드 검색 도구 Semble을 소개하는 Show HN 글. grep 대비 토큰 사용량을 크게 줄여 LLM 워크플로에 맞춘 것이 핵심.

Metal용 DeepSeek 4 Flash 로컬 추론 엔진

DeepSeek 4 Flash local inference engine for Metal

Metal 기반 로컬 추론 엔진 ds4 공개. Apple Silicon 환경에서 DeepSeek 4 Flash를 로컬로 실행하는 구현.

Claude를 사용자 공간 IP 스택으로 동작시켰을 때 ping 응답 속도

How Fast Does Claude, Acting as a User Space IP Stack, Respond to Pings?

Claude를 사용자 공간 IP 스택처럼 동작시키고 ping 응답 지연을 측정한 실험. LLM을 네트워크 계층에 끼워 넣는 비정상적 구현 가능성을 검증함.

Show HN: Tiny-vLLM – C++와 CUDA 기반 고성능 LLM 추론 엔진

Show HN: Tiny-vLLM – high performance LLM inference engine in C++ and CUDA

C++와 CUDA로 구현한 Tiny-vLLM이 소개됨. LLM 추론 성능을 높이기 위한 경량 엔진을 목표로 함.

LLM 시대를 위한 TLA+ 입문: 프롬프트로 승리하기

Intro to TLA+ for the LLM Era: Prompt Your Way to Victory

LLM 워크플로에 TLA+를 적용하는 방법을 소개한 글. 프롬프트와 형식 검증을 결합해 설계 오류를 줄이는 접근을 다룬다.

Show HN: Lowfat – 내 LLM 토큰의 91.8%를 절약한 플러그형 CLI 필터

Show HN: Lowfat – pluggable CLI filter that saved 91.8% of my LLM tokens

CLI 출력을 걸러 LLM에 보내는 토큰을 크게 줄이는 플러그형 필터 도구 Lowfat 소개. 사용 사례에서 토큰 사용량을 91.8% 절감했다고 주장.

LLM에는 boring languages를 사용하라

Use boring languages with LLMs

LLM 개발에는 복잡한 최신 언어보다 단순하고 보수적인 언어가 유리하다는 주장. 유지보수성과 예측 가능성을 강조함.