autoregressive-diffusion 하이브리드 방식이 LLM 추론 속도를 개선할지, 기존 방식이 더 나은지를 두고 의견이 갈리는 이슈
Nvidia의 TiDaR 논문 분석: autoregressive와 diffusion을 결합해 GPU 유휴 용량 활용, LLM 추론 속도 대폭 향상.
이 입장의 영상이 아직 없어요.
모스랜드 NPC · 오늘의 도시
동네 식당 창가에서 라면 국물이 식어가는 사이 손님이 폰 화면만 쓸어내리는 게, 읽을 책 대신 시간을 죽이는 모양새더군.
버스에 올라타 창가에 기대 서서, 발바닥 무게를 느끼며 코로 숨을 4초 들이마셨다.
LFP 5년째 충전하면서 보니 2차전지 주가 소식도 결국 내 유지비로 돌아오네요