Boardunity & Video Forum

Boardunity & Video Forum (https://boardunity.de/)
-   Programmierung und Datenbanken (https://boardunity.de/programmierung-datenbanken-f23.html)
-   -   MySQL: Statitische Erhebungen in Form von Gruppierung bei X/Y Werten (https://boardunity.de/mysql-statitische-erhebungen-form-gruppierung-x-y-werten-t4316.html)

TRS 04.09.2006 12:50

MySQL: Statitische Erhebungen in Form von Gruppierung bei X/Y Werten
 
Liste der Anhänge anzeigen (Anzahl: 1)
So,

ich bin gespannt ob jemand hier eine Lösung für meinen Idee hat, denn diese Idee ist äußerst merkwürdig. Es geht um statistische Erhebungen von Datensätzen und da ist mein Wissen bereits am Ende angelangt, aber bereits ein Stichwort wäre mir hilfreich.

Wir besitzen unzählige Datenpaare aus einer X- und einer Y-Koordinate, welche sich allesamt zwischen einem Minimum (min) und einem Maximum (max) bewegen. Es existieren mehrere Hochpunkte auf der Graden, an welchem sich die Datenpaare stark konzentrieren. Ich habe dies einmal an die Tafel gebracht :D


Die Kreise in der Grafik symbolisieren meine Absicht: Ich wäre interessiert an den relativen Mittelpunkt einer Ansammlung und dem relativen Radius der entsprechenden Ansammlung. Das heißt, bestimmte Parameter wie Radius, Anzahl an Datenpaaren und natürlich die Gesamtzahl an Einkreisungen wären bestimmbar.

So, dann mal viel Spaß ;)

wurstbrot 05.09.2006 12:13

Hallo,

du suchst nach sogenannten Cluster-Zentren. Hier gibt es viele unterschiedliche Methoden. z.B. folgende:

Du sagst, es gibt x verschiedene Clusterzentren. Diese verteilst du in deinem Raum zufällig. Nun verschiebst du jedes Zentrum derart, dass der Abstands-Fehler minimiert wird (i.d.R. in Richtung der Datenpunkte). Das Minimum wirst du irgendwann auf jeden Fall erreichen. Der Fehler wird aber unter Umständen recht hoch sein (er wird in der Praxis nie Null sein). Sollte er zu hoch sein, weißt du, dass du mehr Clusterzentren brauchst. Den Vorgang muss man praktisch iterativ durchführen.

Hört sich recht komplex an, geht bei zwei Dimensionen aber eigentlich ganz gut. Hab vor kurzem mit über 100 Dimensionen gerechnet und das ging dann auch noch recht schnell (natürlich nicht in php).

So, Stichwörter: du findest auf Clusteranalyse - Wikipedia einige Punkte. Helfen dürften dir SOMs (Self Organizing Maps), unter Umständen k-nearest-Neighbour (wobei das eher zur Klassifikation dient, kann aber für Cluster-Berechnung missbraucht werden), relativ sicher der k-means-Algorithmus, sicherlich der LVQ-Algorithmus, unter Umständen der ART-Algorithmus.

Viel Spaß beim Suchen :)

Wurstbrot

TRS 05.09.2006 22:10

Wurstbrote, nicht nur zum Essen geeignet. In diesem Fall werde ich morgen sofort mich mal dem Thema auseinander sitzen.


Alle Zeitangaben in WEZ +1. Es ist jetzt 03:33 Uhr.

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25