검색 결과
"open source" · 18개 기사 · GeekNews · AI/ML
VoxCPM2 - 실제 음성과 비슷한 음성 복제가 가능한 다국어 음성 합성 오픈소스
VoxCPM2 - 실제 음성과 비슷한 음성 복제 가능한 다국어 음성 합성 오픈소스
한국어 포함 30개 언어를 지원하며, 언어 태그 없이 텍스트만으로 합성 가능한 다국어 TTS 모델. 샘플 음성 프롬프트로 톤까지 지정할 수 있음.
pi-autoresearch: Karpathy의 AI 자율 실험 아이디어를 범용화한 오픈소스
pi-autoresearch: Karpathy의 "AI 자율 실험" 아이디어를 범용화한 오픈소스
실험 아이디어를 반복 실행해 측정하고, 개선되면 유지하고 아니면 폐기하는 자율 연구 루프를 구현. 터미널 AI 코딩 에이전트 pi를 확장한 오픈소스 프로젝트.
로컬 LLM 생태계에는 Ollama가 필요하지 않다
로컬 LLM 생태계에는 Ollama가 필요하지 않다
Ollama가 초기에는 로컬 LLM 실행을 단순화했지만, 이후 출처 은폐와 클라우드 중심 전환으로 신뢰를 잃었다. 핵심 엔진 llama.cpp의 공로를 가리는 구조도 비판받고 있다.
Qwen3.6-35B-A3B: 에이전틱 코딩 파워, 이제 모두에게 공개
Qwen3.6-35B-A3B: Agentic Coding Power, Now Open to All
알리바바 Qwen 팀이 Qwen3.6-35B-A3B를 오픈소스로 공개. MoE 아키텍처 기반의 에이전틱 코딩용 대규모 언어모델로 범용 활용을 겨냥.
Claude-Ads - Claude Code로 광고 대행사를 대체하기
Claude-Ads - Claude Code로 광고 대행사를 대체하기
Claude Code 스킬로 7개 광고 플랫폼에서 250개 이상 자동 감사 항목을 실행하는 오픈소스 프로젝트. 광고 운영과 점검 업무의 자동화를 겨냥한 도구.
한국 개발자의 오픈소스 Ouroboros, Claude Plan Mode를 제치고 모델링·시뮬레이션 벤치마크 1위 기록
한국 개발자의 오픈소스 Ouroboros, Claude Plan Mode를 제치고 모델링·시뮬레이션 벤치마크 1위 기록
한국 개발자 오픈소스 Ouroboros가 공개 벤치마크에서 전체 1위를 기록. AI-assisted discrete-event simulation 평가에서 Claude Plan Mode를 앞섬.
Show GN: 투자 에이전트
Show GN: 투자 에이전트. 증권사에 수수료 주면서 AI투자 쓰지말고 오픈소스 공유하고 스스로들 구축해요(이게 아...
오픈소스 기반 투자 에이전트를 소개하는 쇼케이스. 기존 증권사 수수료 모델 대신 자체 구축 가능한 구조와 인프라를 강조함.
오픈소스 AI는 반드시 이겨야 한다
오픈소스 AI는 반드시 이겨야 한다
AI를 업무·교육·과학·공공 서비스의 핵심 인프라로 보고, 소수 기업의 조건과 가격에 종속돼서는 안 된다는 주장. 지능 시스템을 연구·배포·감사·교육·보존할 자유를 강조.
Kimi K2.7-Code: 토큰 효율이 개선된 오픈소스 코딩 모델
Kimi K2.7-Code: 토큰 효율이 개선된 오픈소스 코딩 모델
Kimi K2.6 기반 에이전트형 코딩 모델로, 장기 코딩 작업과 복잡한 소프트웨어 엔지니어링 워크플로를 더 효율적으로 처리하도록 개선됨. 사고 토큰 사용량을 약 30% 줄이고 벤치마크 성능도 함께 끌어올렸다고 소개됨.
Show GN: 입으로 낸 소리를 sound effect로 만들어주는 오픈소스 프로젝트 (새로운 사운드 생성 UX)
Show GN: 입으로낸 소리를 Sound effect로 만들어주는 오픈소스 프로젝트 (New UX for sound generation)
입으로 흉내 낸 소리를 원하는 sound effect로 변환하는 오픈소스 모델을 공개한 프로젝트. 영상·게임 제작에서 필요한 소리를 텍스트가 아닌 직관적 입력으로 찾고 생성하는 UX를 제안함.
Agent Executor - Google의 분산 에이전트 런타임 오픈소스
Agent Executor - Google의 분산 에이전트 런타임 오픈소스
Google이 신뢰성·안전성·커스터마이징·효율성을 목표로 한 분산 에이전트 런타임을 오픈소스 공개함. 에이전틱 루프 조율, 이벤트 로깅, 로컬·원격 액터 실행, 실패 시 자동 복구·재개를 지원함.
외주 인력 + LocalAI 조합이 곧 프론티어 랩보다 경제적이 될 것
외주 인력 + LocalAI 조합이 곧 프론티어 랩보다 경제적이 될 것
미국 프론티어 랩의 API 가격 인상으로 저비용 국가 엔지니어와 오픈소스 모델 조합이 대안으로 부상. 최신 프론티어 모델의 가격이 오르며 외주+LocalAI 구성이 비용 효율 측면에서 주목받는다는 분석.
OpenHuman - 개인용 AI 슈퍼 인텔리전스
OpenHuman - 개인용 AI 슈퍼 인텔리전스
일상에 자연스럽게 통합되는 오픈소스 에이전트형 비서가 공개됨. 몇 번의 클릭만으로 설치 후 데스크톱에서 동작하며 Google Meets 참여까지 지원함.
DeepSeek Reasonix - 높은 캐싱과 낮은 비용의 DeepSeek 네이티브 코딩 에이전트
DeepSeek Reasonix - 높은 캐싱과 낮은 비용의 DeepSeek 네이티브 코딩 에이전트
DeepSeek API에 직접 연결되는 오픈소스 터미널 코딩 에이전트. append-only 루프와 byte-stable prefix cache 최적화로 긴 세션에서 캐시 적중률과 토큰 비용 효율을 높임.
Show GN: 오프라인 영상 자막 추출 및 번역 데스크톱 앱 v2.0 (오픈소스)
Show GN: 오프라인 영상 자막 추출 및 번역 데스크톱 앱 v2.0 (오픈소스)
WhisperSubTranslate v2.0은 영상 파일을 로컬에서 처리해 음성을 추출하고 번역된 SRT 자막을 생성하는 데스크톱 앱. whisper.cpp 기반으로 동작하며 클라우드 업로드 없이 오프라인 번역 워크플로를 제공함.
OpenShorts - 무료 오픈소스 클립 생성기 및 AI UGC 비디오 제작 도구
OpenShorts - 무료 오픈소스 클립 생성기 & AI UGC 비디오 제작 도구
긴 영상을 9:16 세로 숏폼으로 자동 변환하는 셀프 호스팅 오픈소스 도구임. TikTok, Reels, YouTube Shorts용 클립 생성, 자동 하이라이트 추출, 얼굴 트래킹 기능을 통합함.
SANA-WM, 1분 720p 비디오를 위한 26억 파라미터 오픈소스 월드 모델
SANA-WM, 1분 720p 비디오를 위한 26억 파라미터 오픈소스 월드 모델
NVIDIA의 SANA-WM이 이미지 1장과 6-DoF 카메라 궤적으로 단일 GPU에서 720p, 1분 길이의 제어 가능한 비디오를 생성함. Hybrid Linear Diffusion Transformer로 긴 롤아웃의 일관성을 유지한다.
영구기관 컨셉의 오픈소스 AI 에이전트 프레임워크
Show GN: Paperclip + Gastown에서 영감을 받은, “영구기관” 컨셉의 오픈소스 AI 에이전트 프레임워크
Paperclip과 Gastown에서 영감을 받은 이 프레임워크는 토큰이 공급되는 한 AI가 스스로 제품을 개발하고 운영하는 '영구기관'을 지향합니다. AI를 단발성 호출이 아닌 지속적인 시스템으로 작동하게 설계한 것이 특징입니다.