Do I pay twice—plan plus API?

Your Digio subscription covers infrastructure, agents, and included Digio Tokens. Managed model usage debits that token balance by actual input/output tokens. GPU rental is an add-on for the machines you control.

Can different agents use different models?

Yes—each agent can have its own default. Tasks and chats can override for a single run without changing the global default.

What is the difference between Sonnet and Opus?

Opus is tuned for harder reasoning and longer coherent plans; Sonnet is faster and cheaper for everyday agent loops. Haiku and flash-class models are best for volume subtasks.

Can I run only my own model and block cloud APIs?

Enterprise workspaces can restrict outbound model providers and route all agent traffic to your GPU endpoint. Hybrid mode is the default for most teams.

Which GPU sizes are available?

Offerings depend on region and demand—commonly 24–80 GB VRAM tiers for 7B–70B class models and multi-GPU nodes for larger stacks. We help size VRAM from your parameter count and quantization.

Does private GPU usage still consume Digio Tokens?

Orchestration (agents, tasks, storage) stays on your plan. Inference on your GPU is billed as GPU time; you may optionally meter token-shaped usage for internal chargeback.

Digion infrastruktuuri

AI-mallit ja GPU

Suorita agentteja hallituissa rajamalleissa jo tänään – tai vuokraa GPU-kapasiteettia, ota käyttöön omat painot ja reititä Digio-tehtävät yksityisiin päätepisteisiin samassa työtilassa.

Claude, GPT, Kaksoset Agenttikohtainen mallivalinta GPU-vuokraus ja BYOM

Luo työtila Suunnitelmat ja tokenit

Hallittuja malleja

Mallit saatavilla Digiosta tänään

Määritä oletusmalli agenttikohtaisesti tai ohita tehtävää kohden. Käyttö mitataan suunnitelmasi saldosta Digio Tokeneissa – samassa lompakossa riippumatta siitä, soittaako agentti Sonnetia, GPT-4o:ta tai Gemini Flashia.

Antrooppinen Claude

Claude Opus 4.7 Lippulaivapäättely, pitkä konteksti, arkkitehtuuri ja strategiatyö.
Claude Opus 4.6 Edellisen sukupolven Opus vakaaseen, korkealaatuiseen analyysiin.
Claude Sonnet 4.6 Päivittäinen ohjain – koodaus, kirjoittaminen ja monivaiheiset agenttisilmukat.
Claude Sonnet 4.5 / 4 Nopeat Sonnet-tasot nopealla välimuistilla tuetuissa työkuormissa.
Claude Haiku 4.5 Pienen viiveen luonnokset, luokitukset ja suuren volyymin alitehtävät.

Käännä kirjaimellisesti: OpenAI

GPT-5.5 / GPT-5.4 / GPT-5.2 Uusin GPT-5-perhe yleisiin ja agenttityökuormiin.
GPT-4.1 & GPT-4o Luotettava multimodaalinen chat ja työkalujen käyttö tuotantoagenteille.
GPT-4o mini Kustannustehokas reititys yhteenvetoja ja kevyitä vaiheita varten.
o3 / o3-pro / o3-mini / o4-mini Päättelyyn keskittyvät mallit matematiikasta, suunnittelusta ja todentamisesta.
GPT-5.3 Codex & Codex mini Koodin generointi, refaktorit ja repo-tietoiset agenttitaidot.

Käännä kirjaimellisesti: Google Gemini

Gemini 2.5 Pro Pitkän kontekstin tutkimus ja strukturoitu poiminta.
Gemini 2.5 Flash Suorituskykyiset agenttivaiheet kilpailukykyisillä token-hinnoilla.
Gemini 2.0 Flash Erittäin nopeat passit jäsentämiseen, merkitsemiseen ja erätöihin.

Avoimet ja erikoistuneet sovellusliittymät

DeepSeek Chat & Reasoner Vahva arvo chat- ja ajatusketjutyylisille tehtäville.
Mistral Large Euroopassa isännöity vaihtoehto monikielisille agenttiryhmille.
Llama 3.3 70B Avoimen painoluokan malli API:n kautta – toimii hyvin yksityisen GPU:n kanssa.
Grok 3 Reaaliaikainen malli uutis- ja sosiaalisten seurantaagenttien käyttöön.
Sonar Pro Hakupohjaisia vastauksia tutkimusagenteille.
Command R+ RAG-ystävälliset yrityskeskustelut ja hakutyönkulut.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

Käyttö

Miten agentit valitsevat mallin

Koordinaattori voi suositella Sonnettia vs Opusta vastaan halvempaa salamamallia tehtävätyypin perusteella. Tehokäyttäjät määrittävät oletusasetukset agenttirooleja kohden – tutkimus Sonnetissa, lopullinen katsaus Opusissa, joukkokoodaus Haikussa tai Gemini Flashissa.

Per agent — default model in agent settings; override in To do or chat when needed.
Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).
Skills stay the same — tools and integrations work across models; only latency and cost profile change.
Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

GPU vuokra

Vuokraa GPU ja käytä omia mallejasi

Tarvitsetko hienosäätöä, ilmarakoista tarkistuspistettä tai ennakoitavissa olevaa päättelyhinnoittelua? Lisää oma GPU-kapasiteetti Digio-työtilaan, asenna haluamasi käyttöpino ja osoita agentit yksityiseen päätepisteeseen.

Dedikoidut tapaukset

Tunti- tai kuukausittaiset GPU-solmut (A100, H100, L40S-luokka), jotka on liitetty vuokraajaasi – erillään muista asiakkaista.

Sinun painosi

Lataa turvalaitteet, GGUF tai vedä rekisteristäsi; suorita Llama, Mistral, Qwen ja mukautettuja hienosäätöjä.

Normaali tarjoilu

ylläpitämäsi vLLM-, TGI-, Ollama- tai säilökuvat – Digio-agentit kutsuvat OpenAI-yhteensopivaa perus-URL-osoitetta.

Sama orkestraatio

Voit tehdä, ryhmäkeskustelu, taidot ja yhteistyö ennallaan – vain päättelytausta on sinun.

Hybridireititys

Lähetä arkaluonteiset vaiheet yksityiselle GPU:lle ja käytä Claudea tai GPT:tä julkiseen tutkimukseen yhdessä työnkulussa.

Yrityksen valvonta

VPC peering, staattinen ulostulo, tarkastuslokit ja mallin sallittujen luettelot säänneltyille ryhmille.

Ota oma malli mukaan

Asenna ja liitä mukautettu malli

Tyypillinen asetus nollasta päätepisteellesi soittaviin agentteihin:

Varaa GPU

Valitse VRAM, alue ja käyttöaika (purske vs. aina päällä). Painojen säilytystila toimitetaan kotelon mukana tai kiinnitetään kauhaisi.
Ota pino käyttöön

Käynnistä näyttökuva tai SSH, asenna CUDA-ohjaimet ja lataa tarkistuspisteet. Terveystarkastukset vahvistavat, että malli on valmis.
Rekisteröi päätepiste

Lisää perus-URL-osoite, API-avain ja mallitunnus työtilan asetuksiin. Digio tarkistaa latenssin ja tunnuksen muodon ennen julkaisemista.
Anna agenteille

Valitse yksityinen mallisi valittujen agenttien oletukseksi; hallitut Claude/GPT-mallit ovat saatavilla rinnakkain.

GPU-vuokra laskutetaan erikseen Digio-tilauksista. Ota yhteyttä kapasiteetin suunnitteluun, SLA-sopimuksiin ja siirtymiseen olemassa olevasta päättelyklusterista.

B2B SaaS -verkkosivuston käyttöliittymätunniste. Käännä natural fi: FAQ

Kysymyksiä malleista ja grafiikkasuorituksista

Hallittujen sovellusliittymien valitseminen vs. itseisännöidyt päätelmät Digiossa.

Maksanko kahdesti – suunnitelma plus API?

Digio-tilauksesi kattaa infrastruktuurin, agentit ja mukana tulevat Digio Tokenit. Hallitun mallin käyttö veloittaa tämän tunnuksen todellisten syöttö-/lähtötunnisteiden mukaan. GPU-vuokraus on lisäosa ohjaamillesi koneille.

Voivatko eri agentit käyttää eri malleja?

Kyllä – jokaisella agentilla voi olla oma oletuksensa. Tehtävät ja keskustelut voivat ohittaa yhden ajon muuttamatta yleistä oletusarvoa.

Mitä eroa on Sonnetin ja Opuksen välillä?

Opus on viritetty kovempaan päättelyyn ja pidempiin johdonmukaisiin suunnitelmiin; Sonetti on nopeampi ja halvempi päivittäisiin agenttisilmukoihin. Haiku- ja flash-luokan mallit sopivat parhaiten volyymialatehtäviin.

Voinko käyttää vain omaa malliani ja estää pilvisovellusliittymiä?

Yritystyötilat voivat rajoittaa lähtevien mallien tarjoajia ja reitittää kaiken agenttiliikenteen GPU-päätepisteeseesi. Hybriditila on oletusarvo useimmille joukkueille.

Mitkä GPU-koot ovat saatavilla?

Tarjoukset riippuvat alueesta ja kysynnästä – yleensä 24–80 Gt:n VRAM-tasot 7B–70B-luokan malleille ja usean grafiikkasuorittimen solmut suurempia pinoja varten. Autamme kokoamaan VRAM-muistin parametrien lukumäärästä ja kvantisoinnista.

Kuluttaako yksityinen GPU-käyttö edelleen Digio Tokeneita?

Orkestrointi (agentit, tehtävät, tallennus) pysyy suunnitelmassasi. GPU:ta koskevat päätelmät laskutetaan GPU-ajana. voit valinnaisesti mitata tunnuksen muotoista käyttöä sisäiseen takaisinperintään.

Tutustu Digioon

Laita mallit töihin

Agentit, tehtävät ja taidot – työtila valitsemasi mallin ympärillä.

Valitse hallittuja malleja tai tuo GPU

Aloita Claudesta ja GPT:stä tänään ja lisää sitten erillinen grafiikkasuoritin, kun olet valmis isännöimään mukautettuja painoja – samat agentit, samat tehtävät, sinun päätelmäsi.

Aloita Vertaile suunnitelmia