Grafikkarten zum Minen oder Rechnen - Graka in einem DL360 G8

    • New
    • Official Post

    Moin,


    gerade dabei mein setup zum Minen bzw. Wärmeerzeugen ;) im Winter zu überarbeiten. Ich plane Rechenleistung dem Wärmebedarf anzupassen. Aktuell sind es zwischen 1.5-3KW.


    Aktuell habe ich ja eine 3090 die ich eher zum Spielen inkl. WaKü hatte, aber gespielt habe ich damit so gut wie gar nicht. Stattdessen wurde sie zum minen von Ethereum (das ist ja seit staking jetzt rum - und eigentlich auch gut so) genutzt. Zur Zeit nutze ich die zum erstellen von Plots für Chia und als remote compute für eine Chia farm (XCH Krypto hat nichts mit dem Samen zu tun ausser evtl. wegen dem Grüntouch absichtlich ähnlichem Namen).


    Meine Homeserver sind ja etwas älter (Workstations im Büro ignorierend:

    • 3x i7 mit Supermicro Mainboard und 64GB RAM PCI-E 3
    • 1*i9 Supermicro mit 128GB RAM und meine ich PCI-E 4
    • 1x HP 360 DL Proliant Server mit 512GB ram und ex Xeon PCI-E 3 (ein slot und keine Stromanschlüsse für Graka)

    In die Supermirco kommen Nvidia 3060 - zwei habe ich schon laufen. Das geht mit den passenden Treibern direkt von Nvidia. d.h. man muss Linux header installieren (oder pve header) und mit entsprechenden verweis installieren ala

    Code
    ./NVIDIA-Linux-x86_64-535.86.05.run --kernel-source-path /usr/src/linux-headers-6.2.16-19-pve/

    d.h. leider bei jedem Kernelwechsel auch Treiber neu erstellen.


    Größeres Problem stellt der HP server da. Ich dachte ich kann da einfach ein externes Netzteil nehmen und die Graka mit Strom versorgen - ging aber nicht. Zumindest bin ich mit eine 2080 und 1080ti gescheitert. Allerdings liefen die auch in einem der Supermicros nicht von daher evtl. auch kaputt (gebraucht gekauft aber mit Rückgabeoption die ich ziehe).


       

    1080ti mit 6 und 8pin Stromanschluss - slot im Supermicro und Strom von 12V Molex.

    Evtl. reichte der Strom von den eigentlich für Diskbackplane Molex Adapter auch nicht.


    Eine 1050 (zwei slots) habe ich zum laufen gebracht - allerdings hat die nur 4GB VRAM was ganz arg an der Kante ist. Sprich mein remote compute process stürz ab und zu wegen out of mem ab. Für optimale Performance bruacht es >= 8GB.


     

    Provisorium - mit PCIE 4 Extender-Kabel liegt die 1050 auf dem Gehäuse. Dass soll nat. ins Gehäuse rein


    Von daher habe ich noch eine P2200 geordert (75W ein Slot, 5GB aus DE gebrauch 200€) und auch China eine P4 (75W ein slot 8GB für 90€). Strom/Leistung wäre vermutlich eher eine T1000 (50W, 8GB RAM) ideal, die finde ich aber nur für 400€ neu.


    Zum Graka vergleich ist diese Seite gut: Technical City oder T1000 (Terminator like :)).

    Plan also von

    • 1050 (die ja halb-lebig geht und wegen 2 slots auch nicht in den Rechner passt) ->

    Folgende sollten passen, nur nicht sicher ob die mit der 10G Netzwerkkarte kollidieren, man wird sehen.

    • P2200 (75W) ->
    • Tesla P4 (75W aber schneller und mehr Speicher) und evtl.
    • T1000 (vermutlich etwas langsamer als P4 aber sparsamer) wenn es um Stromsparen geht.

    Performancevergleich:

    Sowohl die 3090 auf meiner AMD Workstation mit 128GB Ram und NVME Drives wie die 1050 auf dem Xeon system (150GB Ram werden genutzt) mit 1050 brauchen ca. 6-7min zum erstellen eines Chia K32 C19 plots.

    Auf der Workstation bringt eine schnellere Erstellung auch nix mehr, da der transport über das 1G LAN eh der Bottleneck ist. Der HP server ist 10G angebunden und deswegen lohnt hier ein Aufrüsten der Graka durchaus.


    Hier mal ein paar der Erstellungszeiten für die 1050 (zum späteren Vergleich):

    also ziemlich genau 7.13x Minuten (428s) pro K32 C19 plot

  • Olaf Krause

    Changed the title of the thread from “Grafikkarten zum Minen oder Rechnen” to “Grafikkarten zum Minen oder Rechnen - Graka in einem DL360 G8”.
    • New
    • Official Post

    hier mal die ersten Daten einer P2200

    5GB Speicher daher keine Abstürze mehr im -S2 mode vom Plotter wegen out of memory. Der Chip wird aber deutlich wärmer als auf einer 1050.


    Die Karte ist trotz mehr Speichers deutlich langsamer. 7,4xmin contra 7.1xmin - OK 5% so super deutlich dann auch nicht. In Anbetracht, dass der geringe Speicher auf der 1050 ab und zu zum Absturz führt evtl. gar vernachlässigbar.


    hier ein paar technische Daten rechts die P2200: Vergleich 1050TI - P2200


    Anzahl der Shader-Prozessoren 768 1280
    Anzahl der CUDA-Transporter 768 keine Angaben
    Kernfrequenz 1291 MHz 1000 MHz
    Boost-Frequenz 1392 MHz 1493 MHz
    Anzahl der Transistoren 3,300 million 4,400 million
    Technologischer Herstellungsprozess 16 nm 16 nm
    Leistungsaufnahme (TDP) 75 Watt 75 Watt
    Max Temperatur 97 °C keine Angaben
    Texturiergeschwindigkeit 66.82 119.4
    Gleitkomma-Leistung 2,138 gflops keine Angaben


    aus den Daten würde man evtl. nicht schließen, dass es hier bei Chia Plot Erstellung kaum einen Unterschied gibt. Für die P2200 spricht klar 1slot design und 1GB mehr Speicher.


    Die P4 ist aus China unterwegs - ich bin mal gespannt was diese für eine Leistung erzielt. Vor allem auch ob der Zugewinn auf 8GB Speicher hier einen signifikanten Gewinn bringt. Die Frequenzdaten und das alter sprechen eher für die P2200.

    • New
    • Official Post

    Tesla P4 Karte ist angekommen, super klein - höchstens die Hälfte von einer P2200. Manko wird die passive Kühlung sein. Aber gut evtl. reicht die Gehäuselüftung bei der DL.

    Der Chip hat echt schnell 88C scheint um den Dreh rum aber zu bleiben, mal schauen ob die Karte da bleibt wegen Drosselung oder weil das wirklich die Balance zwischen notwendiger Leitung und Kühlung ist. Speicherverbrauch bei ca. 6GB - nutzt so dann leider die 8GB nicht aus. Evtl. kann man da noch was rauskitzeln.

    Nachtrag: nope! zumindest nicht für meine Anwendung, reicht dann knapp nicht - es wären mehr als 8GB notwendig.


    Hier die Performancemessung zum Vergleich

    Also bisher die schnellste von den drei getesten Karten, Die Schwankungen kommen vermutlich vom Throttling wenn die Karte zu warm wird.


    • P4: <7min: 8GB Speicher stabil aber temp. throttling
    • 1050ti: 7,1min 4GB Speicher regelmäßige Crashes von daher effektive eher 7,5min
    • P2200: 7,4min 5GB Speicher stabil
    • New
    • Official Post

    Hier mal die getesteten Karten in Bilder


        

    Oben nach unten: 1050ti, P2200, TEsla P4


        

    1050ti, P2200, P4


    P4 Kühlerabdeckung entfernt sollte etwas besser kühlen im Gehäuseluftstrom.

    • New
    • Official Post
    Code
    Total plot creation time was 366.663 sec (6.11105 min)
    Total plot creation time was 364.336 sec (6.07227 min)
    Total plot creation time was 365.739 sec (6.09564 min)
    Total plot creation time was 365.094 sec (6.0849 min)
    Total plot creation time was 365.686 sec (6.09477 min)
    Total plot creation time was 365.31 sec (6.08849 min)

    nun ziemlich genau 6min pro plot und immer noch ~77C also ca. 10Grad weniger. -> Entfernen des Gehäuses und des Slotbleches hat geholfen.

Participate now!

Don’t have an account yet? Register yourself now and be a part of our community!