검색 결과
"open source" · 31개 기사 · AI/ML
오픈 소스 AI는 반드시 승리해야 한다
Open source AI must win
오픈 소스 AI의 필요성과 우위를 주장하는 글. 폐쇄형 모델 중심 흐름에 맞서 공개 생태계의 경쟁력을 강조함.
MiMo Code가 오픈소스로 공개됨
MiMo Code is now released and open-source
Xiaomi의 MiMo Code가 공개되고 오픈소스로 배포됨. 코드 생성과 개발 보조에 활용할 수 있는 모델로 제시됨.
Show HN: 내가 만든 OSS Agent, Gemini-3-flash-preview에서 TerminalBench 최고 성적
Show HN: OSS Agent I built topped the TerminalBench on Gemini-3-flash-preview
오픈소스 에이전트가 Gemini-3-flash-preview 기반으로 TerminalBench 상위 성적을 기록. 터미널 작업 수행 능력을 강조한 데모성 공개.
SANA-WM, 1분 720p 비디오를 위한 2.6B 오픈소스 world model
SANA-WM, a 2.6B open-source world model for 1-minute 720p video
SANA-WM은 1분 길이 720p 비디오를 다루는 26억 파라미터 오픈소스 world model. 대규모 비디오 생성과 시뮬레이션 연구용 모델로 제시됐다.
로컬 AI가 표준이 되어야 함
Local AI needs to be the norm
AI 실행을 클라우드가 아닌 로컬 환경 중심으로 전환해야 한다는 주장. 프라이버시와 비용, 지연시간 측면의 이점을 강조함.
Mike: 오픈소스 법률 AI
Mike: open-source legal AI
법률 업무를 돕는 오픈소스 AI 도구를 소개함. 법률 문서 처리와 법무 자동화에 초점을 둔 제품으로 보임.
Papers with Code 되살리기
Reviving Papers with Code
paperswithcode를 다시 활성화하려는 시도. 논문과 코드 연결 인프라를 복원해 AI 연구 재현성과 탐색성을 유지하려는 흐름.
DeepSeek 관련 메모
Notes on DeepSeek
DeepSeek에 대한 관찰과 메모를 정리한 글. 모델 성능, 비용 효율, AI 업계 파급 효과를 다룸.
DeepSeek-R1의 오픈 재현
Open Reproduction of DeepSeek-R1
DeepSeek-R1을 공개적으로 재현한 오픈 프로젝트가 등장함. 오픈 모델 재현성과 학습 절차 검증에 대한 관심이 커짐.
Odysseus – 셀프 호스팅 AI 워크스페이스
Odysseus – self-hosted AI workspace
셀프 호스팅 방식으로 동작하는 AI 워크스페이스 프로젝트. 로컬 또는 자체 인프라에서 AI 작업 흐름과 도구를 묶어 쓰는 환경을 제공함.
Claude.ai와 ChatGPT처럼 어떤 AI 에이전트든 사용할 수 있는 오픈소스 메모리 레이어
Open source memory layer so any AI agent can do what Claude.ai and ChatGPT do
AI 에이전트용 오픈소스 메모리 레이어를 소개하는 글. 대화형 AI의 장기 기억과 상태 관리를 범용화하려는 시도다.
Models.dev: AI 모델 사양, 가격, 기능을 모은 오픈소스 데이터베이스
Models.dev: open-source database of AI model specs, pricing, and capabilities
Models.dev가 AI 모델의 사양, 가격, 기능 정보를 모은 오픈소스 데이터베이스로 소개됨. 여러 모델을 비교해 선택하기 위한 레퍼런스 성격이 강함.
ZAYA1-8B, 1B 미만 활성 파라미터로 DeepSeek-R1 수준의 수학 성능 달성
ZAYA1-8B matches DeepSeek-R1 on math with less than 1B active parameters
ZAYA1-8B가 매우 적은 활성 파라미터로 수학 벤치마크에서 DeepSeek-R1에 맞먹는 성능을 보였다는 내용. 소형 모델의 효율성과 추론 성능 경쟁이 부각됨.
VoxCPM2 - 실제 음성과 비슷한 음성 복제가 가능한 다국어 음성 합성 오픈소스
VoxCPM2 - 실제 음성과 비슷한 음성 복제 가능한 다국어 음성 합성 오픈소스
한국어 포함 30개 언어를 지원하며, 언어 태그 없이 텍스트만으로 합성 가능한 다국어 TTS 모델. 샘플 음성 프롬프트로 톤까지 지정할 수 있음.
pi-autoresearch: Karpathy의 AI 자율 실험 아이디어를 범용화한 오픈소스
pi-autoresearch: Karpathy의 "AI 자율 실험" 아이디어를 범용화한 오픈소스
실험 아이디어를 반복 실행해 측정하고, 개선되면 유지하고 아니면 폐기하는 자율 연구 루프를 구현. 터미널 AI 코딩 에이전트 pi를 확장한 오픈소스 프로젝트.
로컬 LLM 생태계에는 Ollama가 필요하지 않다
로컬 LLM 생태계에는 Ollama가 필요하지 않다
Ollama가 초기에는 로컬 LLM 실행을 단순화했지만, 이후 출처 은폐와 클라우드 중심 전환으로 신뢰를 잃었다. 핵심 엔진 llama.cpp의 공로를 가리는 구조도 비판받고 있다.
Qwen3.6-35B-A3B: 에이전틱 코딩 파워, 이제 모두에게 공개
Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All
알리바바 Qwen 팀이 Qwen3.6-35B-A3B를 오픈소스로 공개. MoE 아키텍처 기반의 에이전틱 코딩용 대규모 언어모델로 범용 활용을 겨냥.
Claude-Ads - Claude Code로 광고 대행사를 대체하기
Claude-Ads - Claude Code로 광고 대행사를 대체하기
Claude Code 스킬로 7개 광고 플랫폼에서 250개 이상 자동 감사 항목을 실행하는 오픈소스 프로젝트. 광고 운영과 점검 업무의 자동화를 겨냥한 도구.
한국 개발자의 오픈소스 Ouroboros, Claude Plan Mode를 제치고 모델링·시뮬레이션 벤치마크 1위 기록
한국 개발자의 오픈소스 Ouroboros, Claude Plan Mode를 제치고 모델링·시뮬레이션 벤치마크 1위 기록
한국 개발자 오픈소스 Ouroboros가 공개 벤치마크에서 전체 1위를 기록. AI-assisted discrete-event simulation 평가에서 Claude Plan Mode를 앞섬.
Show GN: 투자 에이전트
Show GN: 투자 에이전트. 증권사에 수수료 주면서 AI투자 쓰지말고 오픈소스 공유하고 스스로들 구축해요(이게 아...
오픈소스 기반 투자 에이전트를 소개하는 쇼케이스. 기존 증권사 수수료 모델 대신 자체 구축 가능한 구조와 인프라를 강조함.
오픈소스 AI는 반드시 이겨야 한다
오픈소스 AI는 반드시 이겨야 한다
AI를 업무·교육·과학·공공 서비스의 핵심 인프라로 보고, 소수 기업의 조건과 가격에 종속돼서는 안 된다는 주장. 지능 시스템을 연구·배포·감사·교육·보존할 자유를 강조.
Kimi K2.7-Code: 토큰 효율이 개선된 오픈소스 코딩 모델
Kimi K2.7-Code: 토큰 효율이 개선된 오픈소스 코딩 모델
Kimi K2.6 기반 에이전트형 코딩 모델로, 장기 코딩 작업과 복잡한 소프트웨어 엔지니어링 워크플로를 더 효율적으로 처리하도록 개선됨. 사고 토큰 사용량을 약 30% 줄이고 벤치마크 성능도 함께 끌어올렸다고 소개됨.
Show GN: 입으로 낸 소리를 sound effect로 만들어주는 오픈소스 프로젝트 (새로운 사운드 생성 UX)
Show GN: 입으로낸 소리를 Sound effect로 만들어주는 오픈소스 프로젝트 (New UX for sound generation)
입으로 흉내 낸 소리를 원하는 sound effect로 변환하는 오픈소스 모델을 공개한 프로젝트. 영상·게임 제작에서 필요한 소리를 텍스트가 아닌 직관적 입력으로 찾고 생성하는 UX를 제안함.
Agent Executor - Google의 분산 에이전트 런타임 오픈소스
Agent Executor - Google의 분산 에이전트 런타임 오픈소스
Google이 신뢰성·안전성·커스터마이징·효율성을 목표로 한 분산 에이전트 런타임을 오픈소스 공개함. 에이전틱 루프 조율, 이벤트 로깅, 로컬·원격 액터 실행, 실패 시 자동 복구·재개를 지원함.
외주 인력 + LocalAI 조합이 곧 프론티어 랩보다 경제적이 될 것
외주 인력 + LocalAI 조합이 곧 프론티어 랩보다 경제적이 될 것
미국 프론티어 랩의 API 가격 인상으로 저비용 국가 엔지니어와 오픈소스 모델 조합이 대안으로 부상. 최신 프론티어 모델의 가격이 오르며 외주+LocalAI 구성이 비용 효율 측면에서 주목받는다는 분석.
OpenHuman - 개인용 AI 슈퍼 인텔리전스
OpenHuman - 개인용 AI 슈퍼 인텔리전스
일상에 자연스럽게 통합되는 오픈소스 에이전트형 비서가 공개됨. 몇 번의 클릭만으로 설치 후 데스크톱에서 동작하며 Google Meets 참여까지 지원함.
DeepSeek Reasonix - 높은 캐싱과 낮은 비용의 DeepSeek 네이티브 코딩 에이전트
DeepSeek Reasonix - 높은 캐싱과 낮은 비용의 DeepSeek 네이티브 코딩 에이전트
DeepSeek API에 직접 연결되는 오픈소스 터미널 코딩 에이전트. append-only 루프와 byte-stable prefix cache 최적화로 긴 세션에서 캐시 적중률과 토큰 비용 효율을 높임.
Show GN: 오프라인 영상 자막 추출 및 번역 데스크톱 앱 v2.0 (오픈소스)
Show GN: 오프라인 영상 자막 추출 및 번역 데스크톱 앱 v2.0 (오픈소스)
WhisperSubTranslate v2.0은 영상 파일을 로컬에서 처리해 음성을 추출하고 번역된 SRT 자막을 생성하는 데스크톱 앱. whisper.cpp 기반으로 동작하며 클라우드 업로드 없이 오프라인 번역 워크플로를 제공함.
OpenShorts - 무료 오픈소스 클립 생성기 및 AI UGC 비디오 제작 도구
OpenShorts - 무료 오픈소스 클립 생성기 & AI UGC 비디오 제작 도구
긴 영상을 9:16 세로 숏폼으로 자동 변환하는 셀프 호스팅 오픈소스 도구임. TikTok, Reels, YouTube Shorts용 클립 생성, 자동 하이라이트 추출, 얼굴 트래킹 기능을 통합함.
SANA-WM, 1분 720p 비디오를 위한 26억 파라미터 오픈소스 월드 모델
SANA-WM, 1분 720p 비디오를 위한 26억 파라미터 오픈소스 월드 모델
NVIDIA의 SANA-WM이 이미지 1장과 6-DoF 카메라 궤적으로 단일 GPU에서 720p, 1분 길이의 제어 가능한 비디오를 생성함. Hybrid Linear Diffusion Transformer로 긴 롤아웃의 일관성을 유지한다.
영구기관 컨셉의 오픈소스 AI 에이전트 프레임워크
Show GN: Paperclip + Gastown에서 영감을 받은, “영구기관” 컨셉의 오픈소스 AI 에이전트 프레임워크
Paperclip과 Gastown에서 영감을 받은 이 프레임워크는 토큰이 공급되는 한 AI가 스스로 제품을 개발하고 운영하는 '영구기관'을 지향합니다. AI를 단발성 호출이 아닌 지속적인 시스템으로 작동하게 설계한 것이 특징입니다.