Samstag, 3. März 2012

Von SPARQL, ARC2 SKOS und anderen Lebensformen

2beemedia Brainbugs OHG - Das eMagazin

Schema.org ist ein schneller Einstieg auf dem Weg, um einem Inhalt mehr Bedeutung - im Sinne von semantischen Inhalten - zu stiften.

Wer einmal an dieser Oberfläche gekratzt hat, der stößt unweigerlich auf
  • OpenData
  • SKOS (SIMPLE KNOWLEDGE ORGANIZATION SYSTEM, eine einfache Art und Weise, um strukturiertes Vokabular, maschinenlesbar für das Semantische Web bereitzustellen), 
  • ARC2 (Implementierung eines OpenSource RDF Systems für PHP und MySQL)
  • SPARQL (Protokoll  und Abfragesprache für RDF) und taucht dann sicherlich auch eine gewisse Zeit in 
  • dbpedia.org ab (z.B. http://dbpedia.org/page/Category:Life >>> http://dbpedia.org/page/Life_on_Mars)
  •  Open Knowledge Foundation (http://okfn.org/) [Open Knowledge sind Inhalte, die Menschen frei verwende, wiederverwenden und verbreiten können, ohne rechtliche, technische oder soziale Einschränkungen. Toll!]
  • http://ckan.org/ (die größte Plattform für Open Source Data)
  • und diverse andere spannende Zweige dieses Gebietes
Um sich eine ersten Überblick von all dem zu verschaffen, der hat als WordPress-Benutzer die Gelegenheit sich ein Plugin von PoolParty.biz herunterzuladen. Es kümmert sich um die automatische Implementierung von kontextbezogenen Thesaurusinformationen. Damit kann dem Text (aus dem Fachgebiet des Thesaurus) mehr sematische Bedeutung gegeben werden, was sich schließlich direkt in einer höheren Wertschätzung durch Suchmaschinen niederschlägt.

Donnerstag, 1. März 2012

2beemedia Brainbugs OHG - Das eMagazin

Auf stackoverflow.com gab mir scor den wertvollen Tipp, folgenden DOCTYPE zu verwenden, wenn ich schema.org benutzen will:
<!DOCTYPE html>
Wow! Dustin Diaz bezeichnet ihn als Skinny DOCTYPE. Ein paar Recherchen dazu ergab, dass auch die Google- Serviceseiten den HTML5! DOCTYPE in dieser rudimentären Form benutzen.

Interessant und lesenswert in diesem Zusammenhang ist einerseits der Beitrag von  Dustin Diaz und andererseits der Browser-Test, den David in seinem Blog David's Web Development Blog  angespricht.  

Fazit: Dieser abgemagerte DOCTYPE ist demnach alles was man braucht und es gibt keine Veranlassung die WEB-Seite mit irgendetwas exotischem auszustatten.

Stopp: ich habe diesen rudimentären DOCTYPE verwendet und gegen W3C validiert. Ganz ohne Anpassungen geht es dann doch nicht. Es gibt einige obsolete meta-Tags und script-Einträge, die aber nicht schwer zu lösen sind. Als deutlich problematischer stellte sich das Thema DC-HTML heraus. Der Dublin Core wollte nicht wie ich wohl wollte.
 Eine Registriereung z.B. von DC.publischer auf WHATWG war mir dann doch zu oversized. In diesem Zusammenhang empfehle ich - das ist als Strafe zu verstehen - sich einmal die Dokumentation von Dublin Core vorzunehmen, es gibt einem das historische Gefühl, das Sisyphus empfunden haben mag.

Mittwoch, 29. Februar 2012

Wird die Relevanz von On-Page Markup steigen?
Um das grobe Interesse an diesem Thema zu ermitteln, habe ich Google Insight Search und das Trend Tool von Icerocket.com bemüht, um mir einen Überblick darüber zu verschaffen, in welchem Konkurrenzverhältnis die Begriffe Schema.org, Microdata, Microformats und RDFa zueinander stehen.

Fazit: bei der Suchanfrage dominiert microformats deutlich vor microdata, schema.org ist abgeschlagen und rdfa ist quasi nicht existent. Die Trendgrafik von Google Insight Search zeigt dies sehr gut:


Die Trendsuche von ICEROCKET.COM zeigt für Blogs ein etwas anderes Bild.

Hier haben die On-Page Markups von Schema.org die Nase vor Microdata. Dies ist nicht ganz verwunderlich, da schon die Suchmaschinen-Blogs das Thema Schema.org von sich aus sehr hoch gehängt haben. Und wann hat man das schon, eine gemeinsame Strategie der großen Suchmaschinene Bing, Google, Yahoo und Yandex, um auf dem Suchfeld der semantischen Ergebnisse gemeinsam einen Schritt nach vorne zu machen? Schema.org wird mit Sicherheit seinen Platz im HTML5 finden.

Dienstag, 28. Februar 2012

WICHTIGER HINWEIS: wird ein Doctype kleiner als HTML5 also z.B. xhtml- transitional-Doctype verwednet, wird ein Dokument nicht validieren, d.h. die Ausgabe ist dann nicht W3C-konform. Abhilfe kann da ggf. nur ein z.Zt. noch experimenteller doctype sein: z.B.: <!DOCTYPE html PUBLIC '-//W3C//DTD XHTML+RDFa 1.0//EN' 'http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd'> [dieser beinhaltet dann HTML5, XHTML 1.1 und RDFa Light 1.1 und sollte somit Microdata in Form von Schema.org verstehen. Es macht dann vielleicht nur Sinn den Schema.org Teil zu validieren, und nicht das gesamte Dokument, weil vielleicht andere Validierungsfehler einem schnell die Suppe verhageln könnten!]. Es wäre jetzt also spannend bei den Entwicklern zu ermitteln, was "best practice" in diesem Zusammenhang ist. 


77UUEE7WJTMY

blogs and feeds welcome on technorati

Auch ein interessantes Verfahren zu Validierung... Man publiziert einfach einen Token mit dem nächsten Post und schon weiß da jemand, in diesem Fall Technorati, dass man der Autor dieses Streams ist. 

77UUEE7WJTMY 
Ich hoffe, dass ich auf meinem Claim Gold finde ;-)

Not a Thing from Another World

Wie ich bereits in meinem Blogbeitrag Anwendung von Schema.org für die Videoindexierung erwähnt habe ist Schema.org durchaus nicht das Ding von einer anderen Welt. Es ist so einfach auf der eigenen Webseite zu benutzen, dass es den geringen Aufwand zum von den Suchmaschinen versprochenen Nutzen in jedem Fall rechtfertigt.

Als kleine Einstiegshilfe habe ich auf http://2bee.de/schema-org-fur-unternehmensangabe/wissensdatenbank einen kurzen Anwendungsfall beschrieben. Natürlich kann man mit Schema.org noch ganz andere Dinge, Werke und Informationen auszeichnen.

Als Kleine Motivationshilfe mag dienen, das Schema.org ein shared project von Bing, Google, Yahoo und Yandex ist.

Montag, 27. Februar 2012

CDN von jquerytools muckt nicht mehr

Gestern hatte ich den Artikel CDN von jquerytools muckt... veröffentlicht, nachdem ich den gesamten Sonntag kein Feedback vom Content Delivery Network http://cdn.jquerytools.org/1.2.6/all/jquery.tools.min.js erhalten hatte, habe ich schon Böses Karma vermutet und als Erste Hilfe die Bibliothek per localhosting bereitgestellt.

Juhuuu... heute ist der CDN wieder erreichbar und liefert schnell und zuverlässig aus. Hätte mich auch traurig gemacht, wenn JQuery TOOLS was passiert wäre.

Ich werde dies noch ein paar Tage beobachten, öfter mal simplecdn.maxcdn.com pingen und wenn alles dann stabil läuft, wieder auf den CDN-Zugriff umstellen.

Sonntag, 26. Februar 2012

CDN von jquerytools muckt...

Das ist schon ärgerlich, wenn man sich auf das empfohlene Verfahren verlässt und z.B. einen Ressource extern über ein Contet-Delivery-Network (CDN) einbindet und dann das CDN nicht mehr störungsfrei verfügbar ist.

Heute wurden mir diverse Störungen zugetragen, dass bestimmte Funktionen auf einigen von uns betreuten Internetseiten nicht mehr funktionieren würden. Es handelte sich ausnahmslos um Seiten, für die wir JQuery TOOLS einsetzen.

Der Firebug meldete konsequenterweise JQuery-Probleme, sie lagen allerdings nicht an den eingesetzten Scripten, sondern daran, dass die Ressource nicht geladen wurde und so alle nachgelagerten Scripte ins leere liefen. So bekommt der Claim von Flowplayer: "JQuery TOOLS the missing UI library for the web" eine ganz neue Bedeutung. Um sich z.B. einen weiteren HTTP-Request zu sparen kann man sich JQuery TOOLS zusammen mit JQuery ausliefern lassen. Die Bibliothek wird dann unter folgender Adresse bereitgestellt:
http://cdn.jquerytools.org/1.2.6/full/jquery.tools.min.js - ruft man diese Adresse auf, wird Kontakt zu http://simplecdn.maxcdn.com/ aufgenommen. Leider scheint die Ressource z.Zt. nicht störungsfrei abrufbar zu sein. Pingt man die Server über einen gewissen Zeitraum erhält man überwiegend zu 100% eine Zeitüberschreitung der Anforderung also kompletter Verlust der Pakete.

Auf Github wurden bereits vor 2 Tagen Probleme (CDN down) bzgl. JQuery TOOLS gemeldet, die ich von meiner Warte aus aber zu dem Zeitpunkt nicht beobachtet habe. Die Prüfung des Network Status (status.maxcdn.com) brachte aber auch keine befriedigenden neuen Erkenntnisse.

Um JQuery TOOLS jetzt weiter verfügbar zu haben, habe ich mir übergangsweise die Ressource von
Github (https://github.com/jquerytools/jquerytools) beschafft und sie auf dem jeweiligen Server abgelegt.

Ob ein alternativer CDN das Problem langfristig lösen kann, mag ich nicht entscheiden. Zumindestens konnte Google noch folgenden alternativen CDN ermitteln: http://jquerytools.flowplayer.netdna-cdn.com/1.2.6/full/jquery.tools.min.js 


Wünschen wir uns für JQuery TOOLS einen unmissing - Status zurück.
Aber weil wir ungerne auf  JQuery TOOLS verzichten, da es einiges an Komfort bietet, verknüpfen wir es bis auf weiters direkt mit der Domäne.

Anwendung von Schema.org für die Videoindexierung

Na, das hat doch mal gut geklappt.
Ein bisschen Studium der Sekundärquellen und schließlich den On-Page Markup für Videos (für die sog. Videoindexierung ) einfügen. Nach den Vorgaben der Schema.org erledigt sich es wie von selbst.
Statt des beschriebenen <object> embed, habe ich mich allerdings für ein <iframe> embed entschieden, dies geschah allerdings nur der Bequemlichkeit. - Ein kleiner Stolperstein ist die Angabe der Spieldauer (duration) in der Notation nach ISO 8601. Das ist aber nichts, weshalb man darauf verzichten sollte seine Media-Projekte zu indexieren, denn auch hier gilt, wer lesen kann hat mehr Spaß bei der Arbeit ;-)
Und wer gerne nachvollziehen möchte wie ich es geschafft habe, den empfehle ich meinen Artikel zu dem Thema. Er ist zu finden auf unserer Seite (2bee.de/blog) und behandelt die  Videoindexierung  etwas ausführlicher. Vielleicht ist es dem einen oder anderen für den Einstieg in das Thema eine nützliche Hilfe.


Und das Allerbeste kommt zum Schluss: Schema.org hat noch mehr zu bieten und wartet auf weitere konsequente Enthüllungen!