카테고리별 기사
분야별로 기사를 탐색하세요
84개 기사
DeepSeek v4
DeepSeek v4
DeepSeek의 v4 발표 소식. 새 모델 또는 업데이트 버전 공개를 알리는 기술 공지 성격의 글로 보임.
GPT-5.5
GPT-5.5
OpenAI가 GPT-5.5를 공개함. 새 모델의 성능과 활용 방향을 소개하는 발표 글.
DeepSeek v4
DeepSeek v4
DeepSeek v4 관련 API 문서가 공개됨. 새 모델 버전과 연동 방식에 대한 정보가 확인됨.
ChatGPT Images 2.0
ChatGPT Images 2.0
ChatGPT의 이미지 기능이 2.0 버전으로 업데이트됨. 생성 품질과 사용성 개선이 핵심으로 보임.
Claude를 해지했다: 토큰 문제, 품질 하락, 그리고 부실한 지원
I Cancelled Claude: Token Issues, Declining Quality, and Poor Support
Claude 사용 경험에서 토큰 처리 문제와 품질 저하, 고객 지원 문제를 이유로 구독을 해지했다는 글. AI 제품 신뢰성과 운영 품질 이슈를 지적.
Qwen3.6-27B: 27B Dense Model의 플래그십급 코딩 성능
Qwen3.6-27B: Flagship-Level Coding in a 27B Dense Model
27B dense model로 플래그십급 코딩 성능을 내세움. 경량 파라미터 대비 개발 작업용 경쟁력을 강조.
Kimi K2.6: 오픈소스 코딩의 진전
Kimi K2.6: Advancing open-source coding
Kimi K2.6이 오픈소스 코딩 역량을 한 단계 끌어올리는 업데이트로 소개됨. 코드 생성과 개발 보조 성능 강화가 핵심.
AI 과제물 방지를 위해 타자기를 도입한 대학 강사
College instructor turns to typewriters to curb AI-written work
생성형 AI를 이용한 부정행위를 막기 위해 대학 수업에서 타자기를 도입한 사례를 소개합니다. 기술의 발전 속에서 교육의 본질과 학생들의 비판적 사고 능력을 어떻게 유지할지에 대한 고민을 담고 있습니다.
Qwen3.6-Max-Preview: 더 똑똑하고 더 날카롭지만 여전히 진화 중
Qwen3.6-Max-Preview: Smarter, Sharper, Still Evolving
Qwen3.6-Max-Preview가 향상된 추론과 응답 품질을 내세우며 공개됨. 프리뷰 단계인 만큼 추가 개선 여지가 남아 있음.
Atlassian, AI 학습을 위해 기본 데이터 수집을 활성화
Atlassian enables default data collection to train AI
Atlassian이 AI 학습용 데이터 수집을 기본값으로 켜는 정책을 도입함. 사용자 데이터 활용과 동의 설정을 둘러싼 논란이 예상됨.
아마추어가 ChatGPT로 Erdős 문제를 푼 사례
Amateur armed with ChatGPT solves an Erdős problem
비전문가가 ChatGPT를 활용해 수학 난제를 해결한 사례를 소개. 생성형 AI가 연구 보조와 문제 풀이에 미치는 영향이 부각됨.
OpenAI 광고 파트너, 'prompt relevance' 기준으로 ChatGPT 광고 지면 판매 시작
OpenAI ad partner now selling ChatGPT ad placements based on “prompt relevance”
ChatGPT 광고를 사용자의 프롬프트와의 관련성에 따라 판매하는 광고 상품이 등장. OpenAI 생태계에서 대화형 광고 타기팅이 본격화되는 흐름이다.
모델에서 직접 실시간 스트리밍된 웹사이트
Website streamed live directly from a model
웹사이트가 모델에서 직접 실시간으로 스트리밍되는 방식이 공개됨. 생성형 모델이 UI와 페이지 렌더링까지 직접 밀어주는 실험적 구조로 보임.
Kimi vendor verifier – 추론 제공자 정확도 검증
Kimi vendor verifier – verify accuracy of inference providers
Kimi가 추론 제공자별 응답 정확도를 검증하는 vendor verifier를 공개. 모델 호출 품질을 공급자 단위로 비교·점검하는 용도다.
AI 디자인 패턴 기준으로 Show HN 제출물을 점수화하기
Scoring Show HN submissions for AI design patterns
Show HN 게시물을 AI 디자인 패턴 관점에서 평가하는 방법을 다룸. 생성형 AI 결과물의 구조와 품질을 판별하는 기준을 제안.
Deezer, 플랫폼에 하루 업로드되는 곡의 44%가 AI 생성이라고 밝힘
Deezer says 44% of songs uploaded to its platform daily are AI-generated
Deezer가 일일 업로드 음원 중 44%가 AI 생성이라고 밝혔음. 음악 플랫폼에서 생성형 AI 콘텐츠 비중이 빠르게 커지고 있음을 보여줌.
Deep Learning에 대한 과학 이론은 존재할 것이다
There Will Be a Scientific Theory of Deep Learning
딥러닝을 설명하는 과학적 이론의 가능성을 다룬 논문. 경험적 성능을 넘어 일반화와 학습 원리를 체계적으로 해석하려는 흐름을 반영함.
over-editing은 모델이 필요한 범위를 넘어 코드를 수정하는 현상
Over-editing refers to a model modifying code beyond what is necessary
모델이 최소 수정 범위를 넘어서 코드를 과도하게 바꾸는 문제를 설명함. 자동 코딩 보조의 편집 정밀도와 안정성 이슈를 짚음.
Show HN: 에이전트가 관리하는 Karpathy 스타일 LLM 위키
Show HN: A Karpathy-style LLM wiki your agents maintain (Markdown and Git)
Markdown과 Git 기반으로 동작하는 LLM 위키를 소개한다. 에이전트가 문서를 유지·갱신하는 구조를 내세웠다.
Claude Opus 4.6와 4.7 버전 간 시스템 프롬프트 변경 사항
Changes in the system prompt between Claude Opus 4.6 and 4.7
Claude Opus 모델의 4.6 버전과 4.7 버전 사이의 시스템 프롬프트 변화를 분석한 내용입니다. 모델의 동작 방식과 지침이 어떻게 업데이트되었는지 기술적인 관점에서 설명합니다.
Claude Token Counter, 모델 비교 기능 추가
Claude Token Counter, now with model comparisons
Claude 토큰 카운터에 모델 비교 기능이 추가됨. 프롬프트 길이와 모델별 토큰 사용량을 비교해 비용과 한도를 가늠하기 쉬워짐.
우리 newsroom AI 정책
Our newsroom AI policy
Ars Technica가 뉴스룸에서 AI를 어떻게 사용할지에 대한 내부 정책을 공개. 생성형 AI의 활용 범위와 검증 기준을 정리함.
에이전트가 당신의 코드를 괴로워하며 읽게 하라
Hear your agent suffer through your code
코드 검토 에이전트가 고생하도록 만드는 실험성 도구 소개. 에이전트의 코드 이해와 디버깅 체감을 활용하는 콘셉트.
Claude.ai와 ChatGPT처럼 어떤 AI 에이전트든 사용할 수 있는 오픈소스 메모리 레이어
Open source memory layer so any AI agent can do what Claude.ai and ChatGPT do
AI 에이전트용 오픈소스 메모리 레이어를 소개하는 글. 대화형 AI의 장기 기억과 상태 관리를 범용화하려는 시도다.
OpenAI, API에 GPT-5.5와 GPT-5.5 Pro 출시
OpenAI releases GPT-5.5 and GPT-5.5 Pro in the API
OpenAI가 API에 GPT-5.5와 GPT-5.5 Pro를 추가함. 고성능 모델 라인업을 API 사용자에게 공개.
Anthropic, OpenClaw식 Claude CLI 사용 재허용
Anthropic says OpenClaw-style Claude CLI usage is allowed again
Anthropic이 Claude CLI의 특정 사용 형태를 다시 허용한다고 밝혔다. OpenClaw 계열 워크플로를 쓰는 사용자에게 영향이 있는 정책 변경이다.
Show HN: Mediator.ai – Nash bargaining과 LLM으로 공정성 체계화
Show HN: Mediator.ai – Using Nash bargaining and LLMs to systematize fairness
Mediator.ai가 Nash bargaining과 LLM을 결합해 공정성 판단을 구조화하는 방식을 소개함. 합의와 배분 문제를 자동화·정형화하려는 시도.
Ternary Bonsai: 1.58비트에서의 최고 지능
Ternary Bonsai: Top Intelligence at 1.58 Bits
극저비트 표현을 활용해 지능형 시스템의 효율과 성능을 탐구하는 제안. ternary 표현으로 모델 압축과 추론 효율을 노린다.
ChatGPT의 Workspace Agents
Workspace Agents in ChatGPT
OpenAI가 ChatGPT에 업무용 Workspace Agents를 도입. 문서, 데이터, 작업 흐름을 에이전트가 대신 처리하는 방향으로 기능을 확장함.
TorchTPU: Google 규모에서 PyTorch를 TPU에 네이티브로 실행하기
TorchTPU: Running PyTorch Natively on TPUs at Google Scale
TPU 환경에서 PyTorch를 네이티브하게 돌리기 위한 TorchTPU를 소개. 대규모 학습과 추론을 위한 성능 및 통합 방식을 다룬다.
질문 8개로 만든 3D Body – 사진도, GPU도 없음
A 3D Body from Eight Questions – No Photo, No GPU
사진 없이 8개 질문만으로 3D 신체를 생성하는 방법을 소개. GPU 없이도 동작하는 경량 추정·생성 접근을 강조.
사람처럼 보이는 AI 에이전트는 덜 필요하다
Less human AI agents, please
AI 에이전트가 사람처럼 보이기보다 도구로서의 역할이 분명해야 한다는 주장. 과도한 의인화보다 명확한 인터페이스와 기대치 관리가 중요하다고 본다.
ChatGPT, Claude, Perplexity, Gemini에 프롬프트를 넣고 Nginx 로그를 살펴본 이야기
I prompted ChatGPT, Claude, Perplexity, and Gemini and watched my Nginx logs
ChatGPT·Claude·Perplexity·Gemini의 접근이 Nginx 로그에 어떻게 남는지 관찰한 글. AI 봇 트래픽과 추천 유입 트래픽 구분, 로그 해석 포인트를 다룸.
Soul Player C64 - 1MHz Commodore 64에서 동작하는 실제 Transformer
Soul Player C64 – A real transformer running on a 1 MHz Commodore 64
1MHz Commodore 64에서 실제 Transformer를 구동한 프로젝트. 극도로 제한된 하드웨어에서의 추론 최적화와 모델 경량화가 핵심이다.
핑퐁 로봇이 최상위 인간 선수들을 꺾음
Ping-pong robot beats top-level human players
핑퐁 로봇이 상위권 인간 선수들을 상대로 승리를 거둠. 로봇 제어와 반응 속도에서의 진전이 확인됨.
AI를 위한 Lambda Calculus 벤치마크
Lambda Calculus Benchmark for AI
AI 시스템의 함수형 추론·계산 능력을 평가하는 Lambda Calculus 벤치마크를 제안. 모델의 논리 처리와 프로그램 이해 성능 비교에 초점.
모든 에이전트는 비동기로 바뀌고 있다
All your agents are going async
에이전트 시스템이 동기식 호출 중심에서 비동기 작업 흐름으로 이동하고 있다는 관점을 다룬다. 병렬 처리와 작업 분리가 에이전트 운영의 핵심이 되고 있다.
Apple Silicon에서 TRELLIS.2 Image-to-3D 생성 모델 네이티브 실행
Show HN: Run TRELLIS.2 Image-to-3D generation natively on Apple Silicon
Apple Silicon 환경에서 TRELLIS.2 모델을 사용하여 이미지로부터 3D 모델을 생성할 수 있는 도구가 공개되었습니다. 별도의 서버 없이 로컬 환경에서 고성능 3D 생성 작업을 수행할 수 있는 것이 특징입니다.
Show HN: 브라우저에서 작동하는 Gemma 4 E2B 기반 Prompt-to-Excalidraw 데모 (3.1GB)
Show HN: Prompt-to-Excalidraw demo with Gemma 4 E2B in the browser (3.1GB)
브라우저 안에서 Gemma 4 E2B를 활용해 텍스트 프롬프트를 Excalidraw 다이어그램으로 변환하는 데모다. 대형 모델을 웹에서 직접 구동하면서도 실용적인 시각화 워크플로우를 보여준다는 점에서 주목할 만하다.
MuJoCo – 고급 물리 시뮬레이션
MuJoCo – Advanced Physics Simulation
로봇 공학과 제어 연구에 널리 쓰이는 물리 시뮬레이터 MuJoCo 소개 글. 정밀한 동역학 시뮬레이션과 학습 환경 구축에 활용됨.
AI 코딩 시대, 성장이 멈추는 개발자의 뇌에서 일어나는 일
AI 코딩 시대, 성장이 멈추는 개발자의 뇌에서 일어나는 일
AI를 잘 쓰는 핵심은 출력물의 품질을 판단하고 교정하는 능력이며, 과의존은 이 능력을 약화시킨다는 주장. 개발 역량 저하의 메커니즘을 뇌 인지 관점에서 설명함.
AI 코딩 시대, 성장이 멈추는 개발자의 뇌에서 일어나는 일
AI 코딩 시대, 성장이 멈추는 개발자의 뇌에서 일어나는 일
AI에 지나치게 의존하면 출력물을 판단하고 교정하는 능력이 저하되어 개발자의 성장이 멈출 수 있습니다. 학습 과정에서 겪는 '바람직한 어려움'이 장기 기억과 실력 향상에 필수적이므로, AI를 도구로 활용하되 비판적 사고를 유지하는 것이 중요합니다.
VoxCPM2 - 실제 음성과 비슷한 음성 복제가 가능한 다국어 음성 합성 오픈소스
VoxCPM2 - 실제 음성과 비슷한 음성 복제 가능한 다국어 음성 합성 오픈소스
한국어 포함 30개 언어를 지원하며, 언어 태그 없이 텍스트만으로 합성 가능한 다국어 TTS 모델. 샘플 음성 프롬프트로 톤까지 지정할 수 있음.
SuperGemma4 - Google Gemma 4 26B의 비검열·속도개선·양자화 모델
SuperGemma4 - 구글 Gemma 4 26B의 비검열/속도개선/양자화 모델
Gemma 4 26B IT를 MLX로 최적화한 4비트 양자화 텍스트 모델. 애플 실리콘에서 더 작고 빠르게 구동되는 비검열 파생판.
pi-autoresearch: Karpathy의 AI 자율 실험 아이디어를 범용화한 오픈소스
pi-autoresearch: Karpathy의 "AI 자율 실험" 아이디어를 범용화한 오픈소스
실험 아이디어를 반복 실행해 측정하고, 개선되면 유지하고 아니면 폐기하는 자율 연구 루프를 구현. 터미널 AI 코딩 에이전트 pi를 확장한 오픈소스 프로젝트.
Claude Code 및 Codex 설정 변경을 통한 토큰 절약 전략
Claude Code 및 Codex 설정 변경으로 토큰을 절약하는 방법
Claude Opus 4.7 출시 이후 토큰 사용량 증가가 이슈가 되면서, 효율적인 토큰 관리가 중요해졌습니다. Claude Code와 Codex 환경에서 설정을 최적화하여 비용을 절감하고 성능을 유지하는 구체적인 방법론을 다룹니다.
로컬 LLM 생태계에는 Ollama가 필요하지 않다
로컬 LLM 생태계에는 Ollama가 필요하지 않다
Ollama가 초기에는 로컬 LLM 실행을 단순화했지만, 이후 출처 은폐와 클라우드 중심 전환으로 신뢰를 잃었다. 핵심 엔진 llama.cpp의 공로를 가리는 구조도 비판받고 있다.
Anthropic, Claude Design 공개
Anthropic, Claude Design 공개
Claude Opus 4.7 비전 모델 기반의 협업형 시각 디자인 도구를 공개했다. 디자인, 프로토타입, 슬라이드, 원페이저 등 완성도 높은 작업물 제작을 지원한다.
Qwen3.6-35B-A3B: 에이전틱 코딩 파워, 이제 모두에게 공개
Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All
알리바바 Qwen 팀이 Qwen3.6-35B-A3B를 오픈소스로 공개. MoE 아키텍처 기반의 에이전틱 코딩용 대규모 언어모델로 범용 활용을 겨냥.
Qwen3.5 모델 양자화, 왜 커뮤니티 버전은 성능이 떨어지나
Qwen3.5 모델 양자화, 왜 커뮤니티 버전은 성능이 떨어지나
커뮤니티가 배포한 MLX 포맷 Qwen3.5 양자화 모델에서 도구 호출 오류와 무의미한 출력 문제가 보고됐다. 양자화 품질과 배포 파이프라인 차이가 성능 격차로 이어지고 있다.
Qwen3.5 모델 양자화, 왜 커뮤니티 버전은 성능이 떨어지나
Qwen3.5 모델 양자화, 왜 커뮤니티 버전은 성능이 떨어지나
커뮤니티에서 배포한 Qwen3.5 양자화 모델의 성능 저하 원인이 기술적으로 규명되었습니다. Unsloth는 150개 이상의 벤치마크 실험을 통해 양자화 과정에서 발생하는 도구 호출 오류와 환각 현상의 원인을 분석하고 해결책을 제시했습니다.
OpenMythos: Claude Mythos를 역설계한 오픈소스 구현 등장
OpenMythos: Claude Mythos를 역설계한 오픈소스 구현 등장
Claude Mythos 구조를 가정해 반복적으로 사고하는 트랜스포머 형태로 구현한 오픈소스 프로젝트. Anthropic 차세대 모델 계열을 모사하려는 실험적 시도임.
OpenMythos: Claude Mythos를 역설계한 오픈소스 구현 등장
OpenMythos: Claude Mythos를 역설계한 오픈소스 구현 등장
Anthropic의 차세대 모델로 알려진 Claude Mythos의 구조를 추정하여 '반복적으로 생각하는 트랜스포머' 형태로 재현한 오픈소스 프로젝트입니다. 실제 모델은 아니지만, 최신 AI 모델의 동작 원리를 연구하고 구현 아이디어를 공유하는 데 목적이 있습니다.
Garry Tan의 "Skillify" — AI 에이전트의 실패를 영구적 구조 수정으로 바꾸는 방법론
Garry Tan의 "Skillify" — AI 에이전트의 실패를 영구적 구조 수정으로 바꾸는 방법론
Garry Tan이 AI 에이전트 운영 경험을 바탕으로 Skillify 방법론을 제안했다. 에이전트의 실패를 단발성 수정이 아니라 재발 방지용 구조 개선으로 전환하는 접근이다.
vLLM Recipes 개편 - 모델+하드웨어 조합별 설정을 딸각 한방으로
vLLM Recipes 개편 - 모델+하드웨어 조합별 설정을 딸각 한방으로
vLLM Recipes가 개편돼 모델과 하드웨어 조합에 맞는 실행 설정을 인터랙티브하게 찾을 수 있게 됐다. 어떤 모델을 어떤 서버에서 돌릴지 빠르게 확인하는 용도다.
Google LiteRT-LM - 엣지 디바이스용 고성능 LLM 추론 프레임워크
Google LiteRT-LM - 엣지 디바이스용 고성능 LLM 추론 프레임워크
Google이 Android, iOS, 웹, 데스크톱, IoT 등 엣지 환경에서 동작하는 온디바이스 LLM 추론 엔진 LiteRT-LM을 공개했다. 프로덕션 수준 성능과 범용 배포를 목표로 한다.
Codex, Browser use로 웹사이트 구현 및 검증 지원
Codex, Browser use로 웹사이트 구현 및 검증 지원
Codex 앱 내부에서 Browser Use 플러그인으로 브라우저를 실행해 실제 클릭 기반 테스트와 검증이 가능해짐. 프론트엔드 구현 뒤 동작 확인 흐름을 강화.
Why 2026 Seniors are just highly-paid Code Editors, on Addy Osmani
Why 2026 Seniors are just highly-paid Code Editors, on Addy Osmani
Addy Osmani가 AI 시대 시니어 개발자의 역할 변화를 언급한 인터뷰. 고급 개발자는 직접 코딩보다 코드 편집·검토·의사결정 비중이 커지고 있다는 관점.
Show GN: 카톡 답장 귀찮아서, 폰 안에서 돌아가는 AI 자동응답을 만들었습니다
Show GN: 카톡 답장 귀찮아서, 폰 안에서 돌아가는 AI 자동응답을 만들었습니다
대화 내용을 외부 서버로 보내지 않고 폰 내부에서 돌아가는 카톡 AI 자동응답 도우미를 구현했다. 프라이버시를 유지하면서 메시지 응답을 자동화하는 접근이다.
Google Cloud의 AI 에이전트 거버넌스 스택, "에이전트를 엔지니어 조직처럼 관리하라"
Google Cloud의 AI 에이전트 거버넌스 스택, "에이전트를 엔지니어 조직처럼 관리하라"
Google Cloud가 Cloud Next 26에서 Gemini Enterprise Agent Platform의 거버넌스 스택을 공개했다. AI 에이전트를 조직 단위의 보안·관리 대상으로 다루는 프레임워크를 제시했다.
Google Agents CLI — 코딩 에이전트를 에이전트 빌더로 만드는 메타 도구
Google Agents CLI — 코딩 에이전트를 에이전트 빌더로 만드는 메타 도구
Google이 coding agent를 활용해 Google Cloud 기반 AI 에이전트를 설계하는 메타 도구 agents-cli를 공개. Gemini CLI, Claude Code, Codex 같은 에이전트 워크플로를 빌더 단계로 끌어올리는 방향.
"AI에게 무례할수록 성능이 좋다?" 최신 연구가 경고하는 PM의 소통 위기
"AI에게 무례할수록 성능이 좋다?" 최신 연구가 경고하는 PM의 소통 위기
AI 협업이 늘수록 인간의 소통 습관이 약화될 수 있다는 연구를 소개하며, 무례한 프롬프트가 성능 보장을 뜻하지 않음을 짚음.
ArtifactNet: 코덱 물리학으로 AI 생성 음악을 탐지하는 경량 포렌식 프레임워크
ArtifactNet: 코덱 물리학으로 AI 생성 음악을 탐지하는 경량 포렌식 프레임워크
Suno, Udio, MusicGen, Stable Audio 등 AI 음악 생성기가 남기는 코덱·물리적 잔차를 이용해 탐지하는 프레임워크. 경량 포렌식 방식으로 생성 음악 판별을 시도함.
LLM으로 할 수 있는 비전형적인 일 7가지
LLM으로 할 수 있는 비전형적인 일 7가지
LLM을 단순 챗봇이나 검색 도구 밖의 용도로 쓰는 7가지 활용법을 정리. 데이터 변환, 분류, 보조 자동화 같은 실무형 응용이 중심.
Anthropic, 신규 Pro($20/월) 사용자에게 Claude Code 제공 중단?
Anthropic, 신규 Pro($20/월) 사용자에게 Claude Code 제공 중단?
Anthropic이 월 20달러 Pro 신규 가입자에게서 Claude Code 접근을 제외한 것으로 보인다는 보도다. 기존 Pro/Max 플랜에서 제공되던 범위가 축소된 정황이다.
Uber, AI 코딩 도구 사용 급증으로 올해의 AI 예산 이미 소진
Uber, AI 코딩 도구 사용 급증으로 올해의 AI 예산 이미 소진
AI 코딩 도구 사용 급증으로 Uber가 올해 계획한 AI 예산을 몇 달 만에 소진했다. 전체 연구개발비는 34억 달러 수준으로 전년 대비 9% 증가했다.
Claude 디자인에 대한 고찰과 감상
Claude Design에 대한 생각과 감상
Figma의 복잡한 디자인 시스템이 실제 구현 환경과 괴리되면서 LLM 학습 데이터에서 소외되는 현상을 분석합니다. 디자인 도구의 독자적인 포맷이 AI 시대의 워크플로우에 미치는 영향과 한계를 다룹니다.
Gemini Deep Research Agent API 공개
Gemini Deep Research Agent API 공개
Google이 Gemini Deep Research Agent를 API로 공개. 질문을 받으면 AI가 자체적으로 검색 계획을 세우고 여러 웹 소스를 조사해 답을 구성하는 기능을 제공.
Show GN: Rust/Tauri로 개발한 완전 자동화 AI 소설 생성기 NovelGen AI (로컬 LLM/Google API 지원)
Show GN: Rust/Tauri로 개발한 완전 자동화 AI 소설 생성기 'NovelGen AI' (로컬 LLM/Google API지원)
시드 아이디어만 넣으면 플롯과 챕터를 자동 구성해 소설을 완성하는 Windows용 데스크톱 앱 NovelGen AI가 소개됐다. 로컬 LLM과 Google API를 지원하며 Rust/Tauri로 구현됐다.
2026년 AI 현황을 설명하는 그래프들
2026년 AI 현황을 설명하는 그래프들
AI Index 2026이 벤치마크 성능, 투자, 대중 인식, 컴퓨트, 탄소 배출 등 핵심 지표로 AI 산업 흐름을 집계. 2026년 AI 생태계의 성장과 병목을 한눈에 보여주는 보고서.
Uber, AI 코딩 도구 사용 급증으로 올해 AI 예산 조기 소진
Uber, AI 코딩 도구 사용 급증으로 올해의 AI 예산 이미 소진
Uber가 내부 개발자의 AI 코딩 도구 사용량이 급증함에 따라 올해 책정된 AI 예산을 조기에 모두 소진했습니다. 특히 Claude Code와 같은 도구의 적극적인 도입과 내부 장려 정책이 예산 소진의 주요 원인으로 분석됩니다.
ArtifactNet: 코덱 물리학 기반의 AI 생성 음악 탐지 프레임워크
ArtifactNet: 코덱 물리학으로 AI 생성 음악을 탐지하는 경량 포렌식 프레임워크
상용 AI 음악 생성기가 사용하는 RVQ(Residual Vector Quantization) 과정의 물리적 제약을 이용해 AI 생성 음악을 탐지하는 경량 프레임워크입니다. Suno, Udio 등 주요 생성 모델의 결과물을 효과적으로 식별할 수 있습니다.
Opus 4.6 및 Opus 4.7 토큰 비용 계산기
Opus 4.6과 Opus 4.7의 토큰 비용 계산기
Opus 4.7의 새로운 토크나이저 도입으로 동일한 프롬프트가 더 많은 토큰으로 계산되는 문제를 분석할 수 있는 도구입니다. 콘텐츠 유형에 따라 토큰 매핑이 1.0~1.35배 증가하여 비용 효율성을 재점검할 필요가 있습니다.
Show GN: ModMix — 두 게임을 섞어 새로운 게임 컨셉을 뽑는 AI 도구
Show GN: ModMix — 두 게임을 섞어 새 게임 컨셉을 뽑는 AI 도구
두 게임과 메카닉 태그 3개를 입력하면 1페이지 게임 디자인 문서와 컨셉 아트를 생성하는 도구. 사이드 프로젝트로 만들고 출시했다.
Show GN: 2026년 제9회 전국동시지방선거 출마자를 위한 공약 생성기
Show GN: 2026년 제9회 전국동시지방선거 출마자를 위한 공약 생성기
바이브 코딩으로 지방선거 공약 생성기를 제작. gpt-4o를 활용해 후보자용 공약 초안을 빠르게 만들 수 있게 했음.
OpenMythos: 공개 연구로 복원한 Claude Mythos 아키텍처, 가설인가 또 다른 AI hype인가
OpenMythos: 공개 연구로 복원한 Claude Mythos 아키텍처 가설인가, 또 다른 AI 하이프인가
공개 연구를 바탕으로 Claude Mythos와 유사한 구조를 재구성하려는 이론적 아키텍처 실험을 다룸. 실제 성능 검증보다 아키텍처 추정과 해석에 초점이 있음.
Show GN: 투자 에이전트
Show GN: 투자 에이전트. 증권사에 수수료 주면서 AI투자 쓰지말고 오픈소스 공유하고 스스로들 구축해요(이게 아...
오픈소스 기반 투자 에이전트를 소개하는 쇼케이스. 기존 증권사 수수료 모델 대신 자체 구축 가능한 구조와 인프라를 강조함.
DeepSeek V4: 100만 토큰 컨텍스트를 지원하는 고효율 대규모 언어 모델
DeepSeek v4 : 100만 토큰 컨텍스트를 지원하는 고효율 대규모 언어 모델
DeepSeek V4가 100만 토큰 컨텍스트와 MoE 구조를 제공하는 대규모 언어 모델로 공개. Pro와 Flash 두 버전으로 나뉘며 고효율 추론을 강조.
GPT 5.5 출시
GPT 5.5 출시
공식 문서 공개 전이지만 Pro 사용자 계정의 Codex 앱과 Codex CLI에서 GPT 5.5 모델 노출이 확인됐다. 조기 배포 또는 내부 테스트 정황으로 보인다.
AI 리뷰를 신뢰할 수 있을까요?
AI 리뷰를 신뢰할 수 있을까요?
사내 AI 리뷰 도구의 신뢰도를 검증하기 위해 품질을 정량 측정한 사례. AI가 생성한 리뷰를 실제 운영에 쓰려면 평가 지표와 검증 체계가 필요하다는 문제의식.
AI Harness + Uroboros Template - Claude Code용 AI 에이전트 템플릿
Show GN: AI Harness + Uroboros Template - Claude Code용 AI 에이전트 템플릿
Claude Code 같은 코딩 에이전트가 스펙을 벗어나거나 파일 구조를 훼손하는 문제를 줄이기 위한 템플릿. 작업 레이어와 규칙을 고정해 에이전트 행동을 제어하는 방식.
Show GN: Contexty — AI의 컨텍스트를 개발자가 직접 보고 통제할 수 있게 해주는 도구
Show GN: Contexty — AI의 컨텍스트를 개발자가 직접 보고 통제할 수 있게 해주는 도구
Contexty는 AI 모델의 컨텍스트 관리 문제를 해결하기 위해 개발자가 직접 컨텍스트를 확인하고 제어할 수 있게 해주는 도구입니다. 모델 성능 저하를 방지하고 매번 전제를 설명해야 하는 번거로움을 줄여줍니다.
영구기관 컨셉의 오픈소스 AI 에이전트 프레임워크
Show GN: Paperclip + Gastown에서 영감을 받은, “영구기관” 컨셉의 오픈소스 AI 에이전트 프레임워크
Paperclip과 Gastown에서 영감을 받은 이 프레임워크는 토큰이 공급되는 한 AI가 스스로 제품을 개발하고 운영하는 '영구기관'을 지향합니다. AI를 단발성 호출이 아닌 지속적인 시스템으로 작동하게 설계한 것이 특징입니다.
AI에게 무례할수록 성능이 좋다? 최신 연구가 경고하는 PM의 소통 위기
"AI에게 무례할수록 성능이 좋다?" 최신 연구가 경고하는 PM의 소통 위기
최근 연구에 따르면 AI와의 협업이 잦아질수록 인간의 소통 능력이 퇴보할 수 있다는 우려가 제기되었습니다. 특히 AI에게 무례하게 대할 때 성능이 향상된다는 결과는 인간의 대인 관계 및 소통 방식에 부정적인 영향을 미칠 수 있음을 시사합니다.