|
| LinkBack | Themen-Optionen | Thema bewerten |
#1
| ||||
| ||||
MySQL: Statitische Erhebungen in Form von Gruppierung bei X/Y WertenSo, ich bin gespannt ob jemand hier eine Lösung für meinen Idee hat, denn diese Idee ist äußerst merkwürdig. Es geht um statistische Erhebungen von Datensätzen und da ist mein Wissen bereits am Ende angelangt, aber bereits ein Stichwort wäre mir hilfreich. Wir besitzen unzählige Datenpaare aus einer X- und einer Y-Koordinate, welche sich allesamt zwischen einem Minimum (min) und einem Maximum (max) bewegen. Es existieren mehrere Hochpunkte auf der Graden, an welchem sich die Datenpaare stark konzentrieren. Ich habe dies einmal an die Tafel gebracht Die Kreise in der Grafik symbolisieren meine Absicht: Ich wäre interessiert an den relativen Mittelpunkt einer Ansammlung und dem relativen Radius der entsprechenden Ansammlung. Das heißt, bestimmte Parameter wie Radius, Anzahl an Datenpaaren und natürlich die Gesamtzahl an Einkreisungen wären bestimmbar. So, dann mal viel Spaß |
#2
| |||
| |||
Hallo, du suchst nach sogenannten Cluster-Zentren. Hier gibt es viele unterschiedliche Methoden. z.B. folgende: Du sagst, es gibt x verschiedene Clusterzentren. Diese verteilst du in deinem Raum zufällig. Nun verschiebst du jedes Zentrum derart, dass der Abstands-Fehler minimiert wird (i.d.R. in Richtung der Datenpunkte). Das Minimum wirst du irgendwann auf jeden Fall erreichen. Der Fehler wird aber unter Umständen recht hoch sein (er wird in der Praxis nie Null sein). Sollte er zu hoch sein, weißt du, dass du mehr Clusterzentren brauchst. Den Vorgang muss man praktisch iterativ durchführen. Hört sich recht komplex an, geht bei zwei Dimensionen aber eigentlich ganz gut. Hab vor kurzem mit über 100 Dimensionen gerechnet und das ging dann auch noch recht schnell (natürlich nicht in php). So, Stichwörter: du findest auf Clusteranalyse - Wikipedia einige Punkte. Helfen dürften dir SOMs (Self Organizing Maps), unter Umständen k-nearest-Neighbour (wobei das eher zur Klassifikation dient, kann aber für Cluster-Berechnung missbraucht werden), relativ sicher der k-means-Algorithmus, sicherlich der LVQ-Algorithmus, unter Umständen der ART-Algorithmus. Viel Spaß beim Suchen Wurstbrot |
#3
| ||||
| ||||
Wurstbrote, nicht nur zum Essen geeignet. In diesem Fall werde ich morgen sofort mich mal dem Thema auseinander sitzen. |
Stichworte |
- |
Ähnliche Themen | ||||
Thema | Autor | Forum | Antworten | Letzter Beitrag |
Webspace mit PHP 5 und MySQL 4.1 | Michael Przybyla | Webspace, Webserver, Domains | 14 | 21.02.2008 09:45 |
CSS Abstand = Summe aus zwei Werten | Jan Stöver | Programmierung und Datenbanken | 6 | 20.03.2006 06:48 |
form verursacht unschönen Zeilenabstand | co2.cl | Programmierung und Datenbanken | 3 | 30.10.2005 22:23 |
www.quassel-form.de | sunnygirl_md | Projektvorstellung und Bewertung | 2 | 09.07.2005 22:01 |
Suchmaschinen Forum in vereinfachter form | Promotion | Projektvorstellung und Bewertung | 1 | 12.02.2004 15:55 |