Hallittuja malleja
Mallit saatavilla Digiosta tänään
Määritä oletusmalli agenttikohtaisesti tai ohita tehtävää kohden. Käyttö mitataan suunnitelmasi saldosta Digio Tokeneissa – samassa lompakossa riippumatta siitä, soittaako agentti Sonnetia, GPT-4o:ta tai Gemini Flashia.
Antrooppinen Claude
-
Claude Opus 4.7
Lippulaivapäättely, pitkä konteksti, arkkitehtuuri ja strategiatyö.
-
Claude Opus 4.6
Edellisen sukupolven Opus vakaaseen, korkealaatuiseen analyysiin.
-
Claude Sonnet 4.6
Päivittäinen ohjain – koodaus, kirjoittaminen ja monivaiheiset agenttisilmukat.
-
Claude Sonnet 4.5 / 4
Nopeat Sonnet-tasot nopealla välimuistilla tuetuissa työkuormissa.
-
Claude Haiku 4.5
Pienen viiveen luonnokset, luokitukset ja suuren volyymin alitehtävät.
Käännä kirjaimellisesti:
OpenAI
-
GPT-5.5 / GPT-5.4 / GPT-5.2
Uusin GPT-5-perhe yleisiin ja agenttityökuormiin.
-
GPT-4.1 & GPT-4o
Luotettava multimodaalinen chat ja työkalujen käyttö tuotantoagenteille.
-
GPT-4o mini
Kustannustehokas reititys yhteenvetoja ja kevyitä vaiheita varten.
-
o3 / o3-pro / o3-mini / o4-mini
Päättelyyn keskittyvät mallit matematiikasta, suunnittelusta ja todentamisesta.
-
GPT-5.3 Codex & Codex mini
Koodin generointi, refaktorit ja repo-tietoiset agenttitaidot.
Käännä kirjaimellisesti:
Google Gemini
-
Gemini 2.5 Pro
Pitkän kontekstin tutkimus ja strukturoitu poiminta.
-
Gemini 2.5 Flash
Suorituskykyiset agenttivaiheet kilpailukykyisillä token-hinnoilla.
-
Gemini 2.0 Flash
Erittäin nopeat passit jäsentämiseen, merkitsemiseen ja erätöihin.
Avoimet ja erikoistuneet sovellusliittymät
-
DeepSeek Chat & Reasoner
Vahva arvo chat- ja ajatusketjutyylisille tehtäville.
-
Mistral Large
Euroopassa isännöity vaihtoehto monikielisille agenttiryhmille.
-
Llama 3.3 70B
Avoimen painoluokan malli API:n kautta – toimii hyvin yksityisen GPU:n kanssa.
-
Grok 3
Reaaliaikainen malli uutis- ja sosiaalisten seurantaagenttien käyttöön.
-
Sonar Pro
Hakupohjaisia vastauksia tutkimusagenteille.
-
Command R+
RAG-ystävälliset yrityskeskustelut ja hakutyönkulut.
Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in
pricing.
-
1
Varaa GPU
Valitse VRAM, alue ja käyttöaika (purske vs. aina päällä). Painojen säilytystila toimitetaan kotelon mukana tai kiinnitetään kauhaisi.
-
2
Ota pino käyttöön
Käynnistä näyttökuva tai SSH, asenna CUDA-ohjaimet ja lataa tarkistuspisteet. Terveystarkastukset vahvistavat, että malli on valmis.
-
3
Rekisteröi päätepiste
Lisää perus-URL-osoite, API-avain ja mallitunnus työtilan asetuksiin. Digio tarkistaa latenssin ja tunnuksen muodon ennen julkaisemista.
-
4
Anna agenteille
Valitse yksityinen mallisi valittujen agenttien oletukseksi; hallitut Claude/GPT-mallit ovat saatavilla rinnakkain.
GPU-vuokra laskutetaan erikseen Digio-tilauksista. Ota yhteyttä kapasiteetin suunnitteluun, SLA-sopimuksiin ja siirtymiseen olemassa olevasta päättelyklusterista.