Kam per Mail rein und ich geb es doch gerne weiter.
Ein Beispiel mit der erzeugten Tag-Cloud der Startseite von tentatives verlinken als RSS Feed findet sich unter semager.de/api/tagcloud.php.
Aufgerufen wird die Seite einfach mit http://www.semager.de/api/tagcloud.php?url=http://www.EIGENE-DOMAIN-ANGEBEN.de
Damit lassen sich bestimmt nette Spielereien machen.
Mehr bei http://www.semager.de/blog/api/
Das Script arbeitet auf statistischer Basis. Zunächst extrahiert es alle
H-Tags, den Title, Meta-Description und Meta-Keywords, Bold und Italic Tags,
sowie Alt- und Title Attribute, Linktexte und natürlich alle "normalen"
Wörter.
Anschließend wird Gewichtet. Kommt z.B. ein Wort das in der Meta-Description
vorkommt auch im normalen Text vor, bekommt das Wort ein paar Punkte
gutgeschrieben. Ein Wort das in einem Linktext vorkommt und im
Dokumententitel, bekommt auch Punkte, allerdings eine andere Anzahl. Von
diesen Kombinations-Regeln gibt es dann noch eine ganze Menge weiterer.
Insgesamt bekommt also jedes Wort seine Punkte ab.
Zum Schluss wird sortiert und prozentual runter gebrochen.
Ein Beispiel mit der erzeugten Tag-Cloud der Startseite von tentatives verlinken als RSS Feed findet sich unter semager.de/api/tagcloud.php.
Aufgerufen wird die Seite einfach mit http://www.semager.de/api/tagcloud.php?url=http://www.EIGENE-DOMAIN-ANGEBEN.de
Damit lassen sich bestimmt nette Spielereien machen.
Mehr bei http://www.semager.de/blog/api/
Noch keine Kommentare