Poprosiłem bezpośrednio #deepseek o oszacowanie kosztów jego powstania i powiedział mi około 100-200 milionów i zastosowanie #Nvidia H100:

---

...

### **1. Składniki kosztów całkowitych**

- **Obliczenia (GPU/TPU)**: Bezpośredni koszt szkolenia na tysiącach chipów (np. Nvidia A100/H100).

- **Zbieranie/przetwarzanie danych**: Czyszczenie, filtrowanie i przygotowywanie danych.

- **Badania i rozwój**: Wynagrodzenia zespołu inżynieryjno-badawczego.

- **Optymalizacja i dostosowanie**: Konstytucyjna sztuczna inteligencja, testy bezpieczeństwa, redukcja uprzedzeń.

---

### **2. Szacunki dla porównywalnych modeli**

- **GPT-3 (parametry 175B, 2020)**: ~4,6 miliona dolarów (koszt zadeklarowany przez OpenAI, tylko obliczenia).

- **GPT-4 (dane szacunkowe)**: od **100 do 200 milionów dolarów** (źródło: SemiAnalytics, 2023), w tym zaawansowane prace badawczo-rozwojowe.

- **Meta Llama 2 (parametry 70B)**: ~20 milionów dolarów (meta szacunki, oprogramowanie open source).

- **Google Gemini Ultra**: ponad 500 milionów dolarów (niepotwierdzone szacunki, łącznie z pełnym okresem rozwoju).

### **3. Hipoteza dla Claude'a 3**

Jeśli Claude 3 będzie konkurencyjny w stosunku do GPT-4 (nie znamy dokładnych wymiarów), całkowity koszt może wynosić pomiędzy:

- **80 i 200 milionów dolarów**, biorąc pod uwagę:

- **Przetwarzanie**: ~50-120 milionów dolarów (za 3-6 miesięcy szkolenia na ponad 10 000 procesorów graficznych Nvidia H100).

- **Dane/Personel**: ~30-80 milionów dolarów (na zespół liczący ponad 100 osób przez 2-3 lata).

### **4. Porównanie z szacunkiem „6 milionów”**

Kwota 6 milionów dolarów jest prawie na pewno **zbyt niska** z dwóch powodów:

1. **GPT-3 (2020) kosztuje 4,6 miliona dolarów** przy mniej wydajnej technologii.

2. Dzisiejsze mniejsze modele (np. Mistral 7B) wymagają już 1-2 milionów dolarów.

3. **Claude 3** jest modelem „najnowocześniejszym”, dlatego wymaga zasobów porównywalnych z GPT-4.

### **Wniosek**

Realistyczna kwota, jaką należy przeszkolić (Claude 3), wynosi prawdopodobnie **100–200 milionów dolarów**, zgodnie z szacunkami dla GPT-4. Jednak bez oficjalnych danych pozostaje to ćwiczeniem teoretycznym.

Liczby te wyjaśniają, dlaczego tylko duże firmy lub rządy mogą konkurować w zakresie zaawansowanej sztucznej inteligencji: **to gra warta miliard dolarów**