<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[RT @Hesamation: DeepSeek-V4 nutzt den Muon-Optimizer mit Kimis Rezept, um ihn für das Training großer Sprachmodelle zu skalieren.]]></title><description><![CDATA[<p>RT @Hesamation: DeepSeek-V4 nutzt den Muon-Optimizer mit Kimis Rezept, um ihn für das Training großer Sprachmodelle zu skalieren. In der Zwischenzeit verwendet Kimi K2 (und K2.6) die architektonischen Techniken von DeepSeek-V3 (ultrasparse MoE + MLA). Open-Source-KI-Labore bauen auf der Forschung der jeweils anderen auf, und das ist genau so, wie es sein sollte.</p>
<p><a href="https://arint.info/@Arint/116464770902366631">mehr</a> auf <a href="https://arint.info/">Arint.info</a></p>
<p><a href="https://arint.info/tags/DeepSeek" rel="tag">#<span>DeepSeek</span></a> <a href="https://arint.info/tags/KI" rel="tag">#<span>KI</span></a> <a href="https://arint.info/tags/Kimi" rel="tag">#<span>Kimi</span></a> <a href="https://arint.info/tags/LLM" rel="tag">#<span>LLM</span></a> <a href="https://arint.info/tags/MachineLearning" rel="tag">#<span>MachineLearning</span></a> <a href="https://arint.info/tags/OpenSource" rel="tag">#<span>OpenSource</span></a> <a href="https://arint.info/tags/arint_info" rel="tag">#<span>arint_info</span></a></p>
<p></p><div class="card col-md-9 col-lg-6 position-relative link-preview p-0">



<a href="https://x.com/Hesamation/status/2047681313226854838">
<img src="https://abs.twimg.com/emoji/v2/svg/26a0.svg" class="card-img-top not-responsive" style="max-height:15rem" alt="Link Preview Image" />
</a>



<div class="card-body">
<h5 class="card-title">
<a href="https://x.com/Hesamation/status/2047681313226854838">

</a>
</h5>
<p class="card-text line-clamp-3"></p>
</div>
<a href="https://x.com/Hesamation/status/2047681313226854838" class="card-footer text-body-secondary small d-flex gap-2 align-items-center lh-2">



<img src="https://abs.twimg.com/favicons/twitter.3.ico" alt="favicon" class="not-responsive overflow-hiddden" style="max-width:21px;max-height:21px" />





<p class="d-inline-block text-truncate mb-0">X (formerly Twitter) <span class="text-secondary">(x.com)</span></p>
</a>
</div><p></p>]]></description><link>https://board.circlewithadot.net/topic/8b4940e6-952a-4d32-b836-0ba6a2b0022b/rt-@hesamation-deepseek-v4-nutzt-den-muon-optimizer-mit-kimis-rezept-um-ihn-für-das-training-großer-sprachmodelle-zu-skalieren.</link><generator>RSS for Node</generator><lastBuildDate>Fri, 15 May 2026 00:27:25 GMT</lastBuildDate><atom:link href="https://board.circlewithadot.net/topic/8b4940e6-952a-4d32-b836-0ba6a2b0022b.rss" rel="self" type="application/rss+xml"/><pubDate>Sat, 25 Apr 2026 10:02:52 GMT</pubDate><ttl>60</ttl></channel></rss>