Search
8 results for “llm”
[Qwen3.5 모델 양자화, 왜 커뮤니티 버전은 성능이 떨어지나] 커뮤니티에서 배포한 Qwen3.5 양자화 모델의 성능 저하 원인이 기술적으로 규명되었습니다. Unsloth는 150개 이상의 벤치마크 실험을 통해 양자화 과정에서 발생하는 도구 호출 오류와 환각 현상의 원인을 분석하고 해결책을 제시했습니다.
[Show GN: Contexty — AI의 컨텍스트를 개발자가 직접 보고 통제할 수 있게 해주는 도구] Contexty는 AI 모델의 컨텍스트 관리 문제를 해결하기 위해 개발자가 직접 컨텍스트를 확인하고 제어할 수 있게 해주는 도구입니다. 모델 성능 저하를 방지하고 매번 전제를 설명해야 하는 번거로움을 줄여줍니다.
[몇 달 동안 손으로 코딩하는 중이에요] AI 코딩 에이전트가 대세인 시대에 LLM 없이 직접 코딩하며 기본기를 다지는 개발자의 리트릿 경험담입니다. 컴퓨터의 추상화 계층을 깊이 이해하고 Python 실력을 쌓기 위해 3개월간 수동 코딩에 집중하는 과정을 담고 있습니다.
[Opus 4.6 및 Opus 4.7 토큰 비용 계산기] Opus 4.7의 새로운 토크나이저 도입으로 동일한 프롬프트가 더 많은 토큰으로 계산되는 문제를 분석할 수 있는 도구입니다. 콘텐츠 유형에 따라 토큰 매핑이 1.0~1.35배 증가하여 비용 효율성을 재점검할 필요가 있습니다.
[Claude 디자인에 대한 고찰과 감상] Figma의 복잡한 디자인 시스템이 실제 구현 환경과 괴리되면서 LLM 학습 데이터에서 소외되는 현상을 분석합니다. 디자인 도구의 독자적인 포맷이 AI 시대의 워크플로우에 미치는 영향과 한계를 다룹니다.
[OpenMythos: Claude Mythos를 역설계한 오픈소스 구현 등장] Anthropic의 차세대 모델로 알려진 Claude Mythos의 구조를 추정하여 '반복적으로 생각하는 트랜스포머' 형태로 재현한 오픈소스 프로젝트입니다. 실제 모델은 아니지만, 최신 AI 모델의 동작 원리를 연구하고 구현 아이디어를 공유하는 데 목적이 있습니다.
[Claude Code 및 Codex 설정 변경을 통한 토큰 절약 전략] Claude Opus 4.7 출시 이후 토큰 사용량 증가가 이슈가 되면서, 효율적인 토큰 관리가 중요해졌습니다. Claude Code와 Codex 환경에서 설정을 최적화하여 비용을 절감하고 성능을 유지하는 구체적인 방법론을 다룹니다.
[Claude Opus 4.6와 4.7 버전 간 시스템 프롬프트 변경 사항] Claude Opus 모델의 4.6 버전과 4.7 버전 사이의 시스템 프롬프트 변화를 분석한 내용입니다. 모델의 동작 방식과 지침이 어떻게 업데이트되었는지 기술적인 관점에서 설명합니다.