웹 접근성 Skip Navigation
  • 개인 정보 보호
  • 연락처
  • 보도자료 발송
Cision PR Newswire: news distribution, targeting and monitoring
  • 뉴스
  • 제품
    • 개요
    • PR Newswire배포
    • 유가 게재
    • 시전 커뮤니케이션 클라우드
    • 시전 IR
    • 미디어룸
    • 모든 제품
  • 연락처
    • 일반 문의
    • 데모 요청
    • 파트너십
    • 미디어 문의
When typing in this field, a list of search results will appear and be automatically updated as you type.

귀하의 콘텐츠 검색

검색 결과가 없습니다. 검색어를 바꿔서 다시 해 보십시오.
  • 중점 뉴스
      • 보도자료 검색

      • 보도자료 전체
      • 상장 회사 전체
      • English-only
      • 멀티미디어 전체

      • 멀티미디어 전체
      • 사진 전체
      • 동영상 전체
  • 비즈니스 & 금융
      • 금융 서비스 & 투자

      • 계약
      • 구조조정 & 자본재조정
      • 매출 발표
      • 뮤추얼펀드
      • 배당금
      • 벤처캐피털
      • 보험
      • 부동산
      • 사모 투자
      • 수익
      • 수익 추정 혹은 예측
      • 암호화폐
      • 은행업 & 금융 서비스
      • 인수, 합병과 매수
      • 재무 협약
      • 제공품
      • 주주행동주의
      • 주주 회의
      • 채권 & 주식 등급
      • 컨퍼런스콜 발표
      • 투자 의견
      • 파산
      • 합작사
      • 회계 뉴스와 이슈
      • 전체 보기 금융 서비스 & 투자

      • 비즈니스 기술

      • 나노기술
      • 데이터 분석
      • 반도체
      • 방송기술
      • 블록체인
      • 인터넷 기술
      • 전자 부품
      • 전자상거래
      • 전자 설계 자동화
      • 첨단 보안 기술
      • 컴퓨터 & 전자기기
      • 컴퓨터 네트워크
      • 컴퓨터 소프트웨어
      • 컴퓨터 액세서리
      • 컴퓨터 하드웨어
      • 핀테크
      • 전체 보기 비즈니스 기술

      • 엔터테인먼트와 미디어

      • 광고
      • 도서
      • 라디오 & 팟캐스트
      • 엔터테인먼트
      • 영상 & 영화
      • 예술, 문화와 디자인
      • 음악
      • 잡지
      • 출판 & 정보 서비스
      • 텔레비전
      • 전체 보기 엔터테인먼트와 미디어

      • 일반 비즈니스

      • 기업 확장
      • 뉴스 제품과 서비스
      • 라이선싱 & 마케팅 계약
      • 부고
      • 사회적 책임 투자
      • 산업 전시회 뉴스
      • 상
      • 상업용 부동산
      • 소기업 서비스
      • 수익
      • 아웃소싱 사업
      • 인사 발표
      • 인적 자원과 인력 관리
      • 조사, 여론조사와 연구
      • 주거용 부동산
      • 해외 부동산 (미국 이외)
      • 환경, 사회 및 거버넌스
      • 전체 보기 일반 비즈니스

      • 자동자 & 운송

      • 공급망/물류
      • 여행
      • 운송, 트럭킹 & 철도
      • 자동차
      • 철도와 복합 운송
      • 트럭킹과 철도 운송
      • 항공사 & 항공
      • 항공 운송
      • 해운 & 조선
      • 힝공우주 & 방위
      • 전체 보기 자동자 & 운송

  • 과학 & 기술
      • 소비자 기술

      • STEM(과학, 기술, 공학 수학)
      • 가전제품
      • 데이터 분석
      • 모바일 기기/앱
      • 무선통신
      • 블록체인
      • 소셜미디어
      • 암호화폐
      • 인공지능
      • 전자상거래
      • 전자 설계 자동화
      • 컴퓨터 & 전자기기
      • 컴퓨터 네트워크
      • 컴퓨터 소프트웨어
      • 컴퓨터 액세서리
      • 컴퓨터 하드웨어
      • 클라우드 컴퓨팅 사물인터넷
      • 핀테크
      • 전체 보기 소비자 기술

      • 에너지

      • 광산업
      • 광업 및 금속
      • 대체 에너지
      • 석유 & 에너지
      • 수도 유틸리티
      • 원유와 가스 발견
      • 유틸리티
      • 일반 제조업
      • 전기 설비
      • 천연 가스 유틸리티
      • 화학물질
      • 전체 보기 에너지

      • 중공업 & 제조업

      • HVAC(난방, 환기와 공조)
      • 건설 & 건축
      • 광산업
      • 광업 및 금속
      • 귀금속
      • 기계
      • 농업
      • 담배
      • 머신 툴, 금속 가공 및 야금
      • 일반 제조업
      • 제지, 임산제품과 컨테이너
      • 직물
      • 컴퓨터 액세서리
      • 화학물질
      • 힝공우주 & 방위
      • 전체 보기 중공업 & 제조업

      • 통신

      • VoIP(인터넷 음성 통화)
      • 모바일 기기/앱
      • 무선통신
      • 컴퓨터 네트워크
      • 컴퓨터 액세서리
      • 통신
      • 통신망 사업자와 서비스
      • 통신 장비
      • 전체 보기 통신

      • 환경

      • 보존 & 재활용
      • 자연 재해
      • 친환경 기술
      • 친환경 제품 & 서비스
      • 환경 이슈
      • 환경 정책
      • 전체 보기 환경

  • 라이프스타일 & 건강
      • 건강

      • FDA 승인
      • 건강보험
      • 국제 의료 승인
      • 바이오메트릭스
      • 보조 약품
      • 생명공학
      • 의료 & 병원
      • 의료 장비
      • 의료 제약
      • 임상 실험 및 의학 발견
      • 전염병 통제
      • 정신 건강
      • 제약
      • 치과
      • 피트니스 웰니스
      • 전체 보기 건강

      • 소비재 & 소매

      • 가구 & 인테리어
      • 대마초
      • 동물 & 반려동물
      • 레스토랑
      • 리모델링
      • 맥주, 와인 & 증류주
      • 무알코올 음료
      • 보석
      • 사무용품
      • 생활용품
      • 생활용품, 소비재 & 화장품
      • 소매
      • 슈퍼마켓
      • 완구
      • 유기농 식품
      • 음료
      • 제품 리콜
      • 패션
      • 화장품 & 위생용품
      • 전체 보기 소비재 & 소매

      • 스포츠

      • 스포츠
      • 스포츠 장비 & 액세서리
      • 스포츠 행사
      • 아웃도어, 캠핑 & 하이킹
      • 전체 보기 스포츠

      • 엔터테인먼트와 미디어

      • 광고
      • 도서
      • 라디오 & 팟캐스트
      • 엔터테인먼트
      • 영상 & 영화
      • 예술, 문화와 디자인
      • 음악
      • 잡지
      • 출판 & 정보 서비스
      • 텔레비전
      • 전체 보기 엔터테인먼트와 미디어

      • 여행

      • 놀이공원과 관광 명소
      • 도박 & 카지노
      • 아웃도어, 캠핑 & 하이킹
      • 여객 항공
      • 여행
      • 호텔과 리조트
      • 전체 보기 여행

  • 정책 & 공익
      • 정책 &공익

      • 경제 뉴스, 동향, 분석
      • 공공 안전
      • 교육
      • 기업의 사회적 책임
      • 동물 복지
      • 비영리
      • 유럽 정부
      • 자연 재해
      • 친환경 제품 & 서비스
      • 전체 보기 정책 &공익

  • 사회 & 문화
      • 사회 & 문화

      • LGBTQ+
      • 노인
      • 다양성, 형평성과 포용성
      • 아동 관련 뉴스
      • 여성 관련 뉴스
      • 장애인 뉴스
      • 제대군인
      • 종교
      • 히스패닉 관련 뉴스
      • 전체 보기 사회 & 문화

  • 개요
  • PR Newswire배포
  • 유가 게재
  • 시전 커뮤니케이션 클라우드
  • 시전 IR
  • 미디어룸
  • 모든 제품
  • 일반 문의
  • 데모 요청
  • 파트너십
  • 미디어 문의
  • Hamburger menu
  • PR Newswire: news distribution, targeting and monitoring
  • 보도자료 발송
    • 채팅

    • 시전에 연락
    • 연락처


  • 뉴스
  • 보도자료 발송
  • 개인 정보 보호
  • 중점 뉴스
    • 보도자료 검색
    • 멀티미디어 전
  • 비즈니스 & 금융
    • 금융 서비스 & 투자
    • 비즈니스 기술
    • 엔터테인먼트와 미디어
    • 일반 비즈니스
    • 자동자 & 운송
  • 과학 & 기술
    • 소비자 기술
    • 에너지
    • 중공업 & 제조업
    • 통신
    • 환경
  • 라이프스타일 & 건강
    • 건강
    • 소비재 & 소매
    • 스포츠
    • 엔터테인먼트와 미디어
    • 여행
  • 정책 & 공익
  • 사회 & 문화
    • 사회 & 문화
  • 뉴스
  • 보도자료 발송
  • 개인 정보 보호
  • 개관
  • PRNewswire 배포
  • GPP
  • Cision Global Media Monitoring
  • Cision IR
  • 미디어룸
  • 모든 제품
  • 뉴스
  • 보도자료 발송
  • 개인 정보 보호
  • 일반 문의
  • 데모 요청
  • 파트너십
  • 미디어 문의
  • 뉴스
  • 보도자료 발송
  • 개인 정보 보호

웨카와 오라클 클라우드 인프라스트럭처, 장문맥 AI 추론 처리량 10배 향상 검증

  • USA - English
  • Middle East - Arabic
  • Deutschland - Deutsch
  • Middle East - English
  • France - Français
  • APAC - Traditional Chinese
  • APAC - English
  • India - Hindi
(PRNewsfoto/WekaIO)

뉴스 제공처

WEKA

2026년 06월 10일 06:06 KST

이 기사 공유

Share toX

이 기사 공유

Share toX

OCI H100 인프라 공동 벤치마크에서 GPU 추가 없이 동시 사용자 10배, 토큰 처리량 10배, 제공 토큰 7배 증가

캠벨, 캘리포니아, 2026년 6월 10일 /PRNewswire/ -- AI 데이터 및 메모리 인프라 기업 웨카(WEKA)가 6월 9일 프로덕션 규모 벤치마크를 발표했다. 조직에서 GPU 규모가 같아도 사용자와 토큰이 늘어나면 장문맥 AI 추론의 경제성이 개선된다는 내용이다. 이 벤치마크에 따르면 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure, OCI)에서 Augmented Memory Grid를 탑재한 웨카의 NeuralMesh 플랫폼은 인프라를 추가하지 않고도 DRAM 전용 구성 대비 동시 사용자 10배, 토큰 처리량 10배, GPU당 생성 토큰 7배라는 성능을 발휘한다. 결과는 10만 토큰 컨텍스트 창이 있는 9노드 OCI 베어메탈 H100 클러스터에서 검증됐다.

파블로 셀렘(Pablo Selem) 오라클 클라우드 인프라스트럭처 소프트웨어 개발 수석 디렉터는 "엔터프라이즈 AI 워크로드는 컨텍스트 창과 GPU 활용률의 한계를 한 차원 더 끌어올리고 있다"며 "이번 벤치마크는 OCI에서 웨카 NeuralMesh에 Augmented Memory Grid가 탑재되면 메모리 병목이 사라져 GPU 추가 없이 까다로운 추론 워크로드도 더 큰 규모로 처리 가능함을 보여주는 결과"라고 말했다.

추론의 계산법을 바꾸는 성과 세 가지
베어메탈 H100 클러스터(9 노드, 72 GPU, 10만 토큰 컨텍스트 창, 동시 사용자 수천 명)에서 프로덕션 규모로 검증된 OCI 기반 Augmented Memory Grid 탑재 NeuralMesh는 다음과 같은 성과를 달성했다.

  • 인프라 추가 없이 동시 사용자 10배 증가. Augmented Memory Grid 탑재 NeuralMesh는 5000명이 넘는 동시 사용자까지 확장됐다. 반면 DRAM 전용 구성은 약 600명 수준이었다. 그 결과 활성 캐시 작업 세트가 8.64TiB DRAM에서 사용 가능한 NVMe 287TiB로 커져 캐시 포화 시 발생하는 장애 절벽가 사라졌다. 또 GPU당 더 많은 사용자가 지원돼 같은 투자 시 효율도 높아졌다.
  • 토큰 처리량 10배 향상. 클러스터 내 GPU 모두 출력 증가. OCI에서 Augmented Memory Grid 탑재 NeuralMesh는 초당 약 200만 토큰에 도달했다. 반면 DRAM 전용 기준선은 20만 미만이었다. 검색, 요약, 코드 지원, 다중 턴 에이전트 등 실시간 AI 기능을 운영하는 제품팀에서 처리량은 지원 가능한 사용자 수, 기능 응답 속도, 인프라가 뒷받침할 수 있는 매출의 상한과 직결된다.
  • 제공 토큰 7배 증가. 대규모 환경에서 토큰당 비용을 하락. Augmented Memory Grid 탑재 NeuralMesh는 사용자 2400명을 대상으로 한 1시간 단일 테스트에서 토큰 50억 개을 제공했다. 반면 DRAM 전용 기준선은 7억 개였다. 에이전트형 워크플로를 운영하는 조직에서 DRAM이 포화되면 재계산이 반복돼 GPU 용량이 조용히 소모되며, 이는 토큰당 비용과 ROI에 직접적인 타격을 준다.

리란 즈비벨(Liran Zvibel) 웨카 CEO는 "추론은 GPU가 사용할 수 있는 유효 메모리의 양에 의해 병목이 발생한다"며 "이번 결과는 AI 토큰 경제성이 하드웨어만으로 해결되는 것이 아니라 기존 하드웨어가 수행할 수 있는 작업의 실질적 한계였던 메모리 장벽을 제거해야 해결된다는 사실을 보여주는 것이다. OCI에서 실행되는 Augmented Memory Grid 탑재 NeuralMesh는 비용 대비 매우 높은 효율로 고객에게 훨씬 더 많은 토큰을 제공한다"고 말했다.

컨텍스트 메모리 인프라로 AI 경제성 혁신
추론 수요가 커지면 AI 인프라의 비효율은 누적된다. 모든 키-값(KV) 캐시 축출은 GPU 사이클, 지연 시간, 사용자 경험, 제공되는 모든 토큰의 비용에 부담으로 작용한다. 입력이 일상적으로 10만 토큰가 넘는 장문맥과 에이전트형 워크로드에서는 이 부담이 사소한 오차가 아니다. 프로덕션 AI를 운영하는 조직에서는 단위 경제성에 직접적인 타격이다.

NeuralMesh의 기능인 Augmented Memory Grid는 KV 캐시를 로컬 GPU 메모리에서 분리하고 클러스터 전반에서 접근 가능한 고성능 토큰 웨어하우스에 저장해 아키텍처 수준에서 이 문제를 해결한다. 어떤 호스트든 캐시 적중을 유지한 채 어떤 세션이든 제공할 수 있어 경직된 세션 고정이 사라지는 동시에 DRAM보다 성능은 더 우수하고 로드 밸런싱이 좋아지며 동시성이 증가할 때 수평 확장이 원활하다. 그 결과 AI 에이전트에 필요한 영구 컨텍스트 메모리가 생기고 장문맥 추론을 대규모로 경제적으로 운영할 수 있는 비용 레버가 구현된다.

프로덕션급 입증
OCI는 2026년 5월 13일 자사 AI & Data Science 블로그에 전체 벤치마크 방법론, 시스템 구성, 결과를 공개했다. 9노드 OCI 베어메탈 H100 클러스터에서 실행된 이번 벤치마크는 1000배 더 큰 KV 캐시 용량과 12만 8000개 토큰에서 최대 20배 더 빠른 첫 토큰 생성 시간을 입증한 이전 검증 단계를 넘어서는 결과였다. 이번 최신 단계에서는 프로덕션 환경에서 추론의 전체 경제성, 즉 동시성 밀도, 지속 처리량, 캐시 지속성, 고부하 수요 급증 시 서비스 수준 목표(SLO) 안정성을 테스트한다.

오라클 마켓플레이스에서 제공
Augmented Memory Grid 탑재 NeuralMesh는 웨카 고객과 오라클 마켓플레이스(Oracle Marketplace)에서 정식 제공되며, OCI는 웨카의 독점 클라우드 출시 파트너다. OCI에서 장문맥 추론을 운영하는 조직은 검증된 프로덕션 준비 아키텍처를 지금 배포할 수 있다. OCI와 웨카 Augmented Memory Grid 벤치마크에 대한 자세한 내용은 OCI 블로그(https://blogs.oracle.com/ai-and-datascience/scaling-long-context-inference-on-oci-with-wekas-augmented-memory-grid)를 참조하면 된다.

웨카 소개
웨카는 에이전트형 AI의 경제성을 혁신하는 AI 데이터 및 메모리 인프라 기업이다. 웨카의 NeuralMesh™ 플랫폼은 고성능 데이터 스토리지와 확장 GPU 메모리를 통합한 인프라로 기업과 AI 클라우드 제공업체, AI 구축자는 여기서 학습, 추론, 에이전트형 워크로드를 처리할 수 있다. NeuralMesh는 Augmented Memory Grid를 통해 GPU 메모리 용량을 1000배 확장하고, 첫 토큰 생성 시간을 최대 20배 단축하며, 동일한 GPU 규모에서 동시 사용자를 10배 더 제공한다는 점이 프로덕션 벤치마크에서 입증됐다. 웨카는 포춘 50대 기업의 30%가 신뢰하는 기업으로 조직이 AI를 더 빠르게 확장하고, GPU 활용률을 최적화하며, 제공되는 모든 토큰의 비용을 절감하도록 지원하고 있다. 자세한 내용은 www.weka.io에서 확인하거나 LinkedIn 및 X에서 웨카와 연결하면 된다.

웨카와 W 로고는 웨카IO, Inc.의 등록 상표다. 본 문서에 언급된 기타 상호는 각 소유자의 상표일 수도 있다.

SOURCE WEKA

Modal title

해당 소스에서 제공하는 다른 기사

웨카, 턴키 엔비디아 AI 데이터 플랫폼 솔루션으로 AI 팩토리 배포 기간 수개월에서 수분으로 단축

웨카, 턴키 엔비디아 AI 데이터 플랫폼 솔루션으로 AI 팩토리 배포 기간 수개월에서 수분으로 단축

GTC 2026: AI 스토리지 및 메모리 시스템 기업 웨카(WEKA)가 3월 16일, AI 팩토리 구축에 최적화된 구성 가능한 고성능 인프라를 제공하는 엔터프라이즈 전용 뉴럴메시™(NeuralMesh™) AI 데이터 플랫폼(AIDP)의 일반 출시를 발표했다....

웨카, 엔비디아 BlueField-4 STX에서 더 낮은 토큰당 비용으로 토큰 출력 극대화

웨카, 엔비디아 BlueField-4 STX에서 더 낮은 토큰당 비용으로 토큰 출력 극대화

GTC 2026: AI 스토리지 및 메모리 시스템 기업 웨카(WEKA)가 3월 16일, 엔비디아(NVIDIA) STX 레퍼런스 아키텍처와 자사 뉴럴메시™(NeuralMesh™) 소프트웨어의 통합을 발표했다. 뉴럴메시에서 구동되는 웨카의 혁신적인 증강 메모리...

해당 소스가 발행한 보도자료 더 보기

연락처

  • 일반 문의
  • 데모 요청
  • 파트너십
  • 미디어 문의
  • 전세계 사무실

제품

  • 시전 커뮤니케이션 클라우드
  • 마케터 용
  • 홍보 용
  • IR 및 컴플라이언스 용
  • 에이전시 용
  • 모든 제품

어바웃

  • PRNewswire 소개
  • 시전 소개
  • 채용
  • 웹 접근성
  • 아시아 태평양 – 중국어 간체
  • 아시아 태평양
  • 아시아 태평양 - 번체 중국어
  • 아랍어
  • 브라질
  • 캐나다
  • 체코공화국
  • 덴마크
  • 핀란드
  • 프랑스
  • 독일
  • 인도
  • 인도네시아
  • 이스라엘
  • 이탈리아
  • 멕시코
  • 중동
  • 네덜란드
  • 노르웨이
  • 폴란드
  • 포르투갈
  • 러시아
  • 슬로박공화국
  • 스페인
  • 스웨덴
  • 영국
  • 미국

나의 서비스

  • 보도자료 전체
  • 플랫폼

Do not sell or share my personal information:

  • Submit via [email protected] 
  • Call Privacy toll-free: 877-297-8921

연락처

제품

어바웃

나의 서비스
  • All News Releases
  • Platform
[email protected]
  • 사용 조건
  • 개인 정보 보호 정책
  • 정보 보안 정책
  • 사이트맵
  • 쿠키 설정
  • 접근 권한
저작권 © 2026 Cision US Inc.