Digion infrastruktuuri

AI-mallit ja GPU

Suorita agentteja hallituissa rajamalleissa jo tänään – tai vuokraa GPU-kapasiteettia, ota käyttöön omat painot ja reititä Digio-tehtävät yksityisiin päätepisteisiin samassa työtilassa.

Claude, GPT, Kaksoset Agenttikohtainen mallivalinta GPU-vuokraus ja BYOM
Hallittuja malleja

Mallit saatavilla Digiosta tänään

Määritä oletusmalli agenttikohtaisesti tai ohita tehtävää kohden. Käyttö mitataan suunnitelmasi saldosta Digio Tokeneissa – samassa lompakossa riippumatta siitä, soittaako agentti Sonnetia, GPT-4o:ta tai Gemini Flashia.

Antrooppinen Claude

  • Claude Opus 4.7 Lippulaivapäättely, pitkä konteksti, arkkitehtuuri ja strategiatyö.
  • Claude Opus 4.6 Edellisen sukupolven Opus vakaaseen, korkealaatuiseen analyysiin.
  • Claude Sonnet 4.6 Päivittäinen ohjain – koodaus, kirjoittaminen ja monivaiheiset agenttisilmukat.
  • Claude Sonnet 4.5 / 4 Nopeat Sonnet-tasot nopealla välimuistilla tuetuissa työkuormissa.
  • Claude Haiku 4.5 Pienen viiveen luonnokset, luokitukset ja suuren volyymin alitehtävät.

Käännä kirjaimellisesti: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 Uusin GPT-5-perhe yleisiin ja agenttityökuormiin.
  • GPT-4.1 & GPT-4o Luotettava multimodaalinen chat ja työkalujen käyttö tuotantoagenteille.
  • GPT-4o mini Kustannustehokas reititys yhteenvetoja ja kevyitä vaiheita varten.
  • o3 / o3-pro / o3-mini / o4-mini Päättelyyn keskittyvät mallit matematiikasta, suunnittelusta ja todentamisesta.
  • GPT-5.3 Codex & Codex mini Koodin generointi, refaktorit ja repo-tietoiset agenttitaidot.

Käännä kirjaimellisesti: Google Gemini

  • Gemini 2.5 Pro Pitkän kontekstin tutkimus ja strukturoitu poiminta.
  • Gemini 2.5 Flash Suorituskykyiset agenttivaiheet kilpailukykyisillä token-hinnoilla.
  • Gemini 2.0 Flash Erittäin nopeat passit jäsentämiseen, merkitsemiseen ja erätöihin.

Avoimet ja erikoistuneet sovellusliittymät

  • DeepSeek Chat & Reasoner Vahva arvo chat- ja ajatusketjutyylisille tehtäville.
  • Mistral Large Euroopassa isännöity vaihtoehto monikielisille agenttiryhmille.
  • Llama 3.3 70B Avoimen painoluokan malli API:n kautta – toimii hyvin yksityisen GPU:n kanssa.
  • Grok 3 Reaaliaikainen malli uutis- ja sosiaalisten seurantaagenttien käyttöön.
  • Sonar Pro Hakupohjaisia ​​vastauksia tutkimusagenteille.
  • Command R+ RAG-ystävälliset yrityskeskustelut ja hakutyönkulut.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Käyttö

Miten agentit valitsevat mallin

Koordinaattori voi suositella Sonnettia vs Opusta vastaan ​​halvempaa salamamallia tehtävätyypin perusteella. Tehokäyttäjät määrittävät oletusasetukset agenttirooleja kohden – tutkimus Sonnetissa, lopullinen katsaus Opusissa, joukkokoodaus Haikussa tai Gemini Flashissa.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU vuokra

Vuokraa GPU ja käytä omia mallejasi

Tarvitsetko hienosäätöä, ilmarakoista tarkistuspistettä tai ennakoitavissa olevaa päättelyhinnoittelua? Lisää oma GPU-kapasiteetti Digio-työtilaan, asenna haluamasi käyttöpino ja osoita agentit yksityiseen päätepisteeseen.

Dedikoidut tapaukset

Tunti- tai kuukausittaiset GPU-solmut (A100, H100, L40S-luokka), jotka on liitetty vuokraajaasi – erillään muista asiakkaista.

Sinun painosi

Lataa turvalaitteet, GGUF tai vedä rekisteristäsi; suorita Llama, Mistral, Qwen ja mukautettuja hienosäätöjä.

Normaali tarjoilu

ylläpitämäsi vLLM-, TGI-, Ollama- tai säilökuvat – Digio-agentit kutsuvat OpenAI-yhteensopivaa perus-URL-osoitetta.

Sama orkestraatio

Voit tehdä, ryhmäkeskustelu, taidot ja yhteistyö ennallaan – vain päättelytausta on sinun.

Hybridireititys

Lähetä arkaluonteiset vaiheet yksityiselle GPU:lle ja käytä Claudea tai GPT:tä julkiseen tutkimukseen yhdessä työnkulussa.

Yrityksen valvonta

VPC peering, staattinen ulostulo, tarkastuslokit ja mallin sallittujen luettelot säänneltyille ryhmille.

Ota oma malli mukaan

Asenna ja liitä mukautettu malli

Tyypillinen asetus nollasta päätepisteellesi soittaviin agentteihin:

  1. Varaa GPU

    Valitse VRAM, alue ja käyttöaika (purske vs. aina päällä). Painojen säilytystila toimitetaan kotelon mukana tai kiinnitetään kauhaisi.

  2. Ota pino käyttöön

    Käynnistä näyttökuva tai SSH, asenna CUDA-ohjaimet ja lataa tarkistuspisteet. Terveystarkastukset vahvistavat, että malli on valmis.

  3. Rekisteröi päätepiste

    Lisää perus-URL-osoite, API-avain ja mallitunnus työtilan asetuksiin. Digio tarkistaa latenssin ja tunnuksen muodon ennen julkaisemista.

  4. Anna agenteille

    Valitse yksityinen mallisi valittujen agenttien oletukseksi; hallitut Claude/GPT-mallit ovat saatavilla rinnakkain.

GPU-vuokra laskutetaan erikseen Digio-tilauksista. Ota yhteyttä kapasiteetin suunnitteluun, SLA-sopimuksiin ja siirtymiseen olemassa olevasta päättelyklusterista.

B2B SaaS -verkkosivuston käyttöliittymätunniste. Käännä natural fi: FAQ

Kysymyksiä malleista ja grafiikkasuorituksista

Hallittujen sovellusliittymien valitseminen vs. itseisännöidyt päätelmät Digiossa.

Maksanko kahdesti – suunnitelma plus API?

Digio-tilauksesi kattaa infrastruktuurin, agentit ja mukana tulevat Digio Tokenit. Hallitun mallin käyttö veloittaa tämän tunnuksen todellisten syöttö-/lähtötunnisteiden mukaan. GPU-vuokraus on lisäosa ohjaamillesi koneille.

Voivatko eri agentit käyttää eri malleja?

Kyllä – jokaisella agentilla voi olla oma oletuksensa. Tehtävät ja keskustelut voivat ohittaa yhden ajon muuttamatta yleistä oletusarvoa.

Mitä eroa on Sonnetin ja Opuksen välillä?

Opus on viritetty kovempaan päättelyyn ja pidempiin johdonmukaisiin suunnitelmiin; Sonetti on nopeampi ja halvempi päivittäisiin agenttisilmukoihin. Haiku- ja flash-luokan mallit sopivat parhaiten volyymialatehtäviin.

Voinko käyttää vain omaa malliani ja estää pilvisovellusliittymiä?

Yritystyötilat voivat rajoittaa lähtevien mallien tarjoajia ja reitittää kaiken agenttiliikenteen GPU-päätepisteeseesi. Hybriditila on oletusarvo useimmille joukkueille.

Mitkä GPU-koot ovat saatavilla?

Tarjoukset riippuvat alueesta ja kysynnästä – yleensä 24–80 Gt:n VRAM-tasot 7B–70B-luokan malleille ja usean grafiikkasuorittimen solmut suurempia pinoja varten. Autamme kokoamaan VRAM-muistin parametrien lukumäärästä ja kvantisoinnista.

Kuluttaako yksityinen GPU-käyttö edelleen Digio Tokeneita?

Orkestrointi (agentit, tehtävät, tallennus) pysyy suunnitelmassasi. GPU:ta koskevat päätelmät laskutetaan GPU-ajana. voit valinnaisesti mitata tunnuksen muotoista käyttöä sisäiseen takaisinperintään.

Valitse hallittuja malleja tai tuo GPU

Aloita Claudesta ja GPT:stä tänään ja lisää sitten erillinen grafiikkasuoritin, kun olet valmis isännöimään mukautettuja painoja – samat agentit, samat tehtävät, sinun päätelmäsi.