Archive for the ‘ideas’ Category

Professor Viralo

Have you ever been tired of writing your own tweets? Ever bored of following friends by hand? No time to reply to all the mentions on Twitter?
(more…)

Regular Expressions with TextMate

Just needed to replace some difficult strings in a huge text-file and found this site which explains how to use regular expressions with my favorite editor TextMate.

This small regular expression surrounds for example the value-attributes of elements with quotes, if the value has the length 2.

Find: value=(..)
Replace: value="$1"

ArgoUML Web Start

Just saw that ArgoUML offers a Java Web Start file for the latest stable version. Very usefull if you are en-route and want to create UML diagrams.

http://argouml-downloads.tigris.org/jws/argouml-latest-stable.jnlp

iDisk? Eigener WebDAV-Server die bessere Alternative!

iDisk war mir persönlich immer zu teuer. Vor allen Dingen benötigte ich immer nur eine Funktionalität, nämlich den Speicherplatz auf den Apple-Servern, um dort Dateien auszulagern, so dass ich sie auf mehreren Rechnern nutzen konnte. Auf diesen ganzen iPhoto, Webseiten und Adressbuch-Kram konnte ich gut verzichten.
Was mich allerdings immer noch gestört hat — neben den 100 EUR im Jahr — war die extrem langsame Zugriffszeit auf meine iDisk und der begrenzte Speicher.
Naja und da hab ich mir gedacht, dass eine Alternative her muss. Und siehe da: Debian + Apache2 + WebDAV war die Lösung. Zu dieser Installation gibt es sogar eine Anleitung unter www.debian-administration.org/articles/285. Und letztendlich basiert die iDisk anscheinend ja auch auf WebDAV (Web-based Distributed Authoring and Versioning).
Nun gut, jetzt hab ich einen schnelleren und größeren externen Speicher und die Kosten für den Server hatte ich ja sowieso schon immer. ;)
Zudem hab ich mir mit dem Automator folgendes 2-Komponenten-Skript zusammengeklickt, welches ich beim Hochfahren des Rechners ausführe und somit gleich zum WebDAV-Server verbinde:

WebDAV Automator Skript

Wer natürlich die ganzen Gimmick-Funktionalitäten der iDisk benötigt, für den reicht diese Lösung dann aber doch nicht. ;)

Privacy Survival Guide for social networks

My last posting dealt with privacy in social networks. In one of the comments Tristan Louis made the following statement:

The balance between privacy and openness is an interesting one. I’m not sure of how to address it… yet :)

I thought about it and my first idea was: Disguise your data.

Its not bad if social networks share their data. The bad thing is, if your profile-data from network A can by easily connected to your profile-data from network B. With “easily” i mean especially in an automated way.

So where are the possible junctures between profiles?

  • First of all your Email-Address. Its an unique identifier.
  • Your chosen username.
  • Your name. Not unique but a possible connection.
  • Your address.
  • A picture of you. Modern image recognition algorithms are available and can answer the question if two pictures are equal or not.
  • The contacts you invite.
  • The URL of your homepage.

So what can you do to avoid the connection of profiles?

  1. One social network = one new email-address. Use different email-addresses in every network.
  2. Use different usernames.
  3. Yes, also use different names. Ok, you don’t need to rename yourself into ‘Peter’ if your name is ‘Daniel’. But make little changes in your first- and especially in your lastname (the firstname is often used if the social platform gets in contact with you. The lastname is not so important.)
  4. Always use a fake address. No social platform needs your real address.
  5. If you want to use a personal picture in the social network always use a new one for each network you take part in.
  6. Do not always invite the same people in every network. Your personal circle of friends is also like a huge identifier.
  7. Avoid to reveal the URL of your personal homepage.
  8. Change your day of birth. Minor “modifications” are sufficient (e.g. change your day +/- 5)

If you follow these tips, every network you use will get a unique profile. So its nearly impossible to find a connection of profiles between different networks — in an automated way.
Ok, if a real human wants to get the connection he will get it. But you can complicate it. ;)

Managing your identity

I just thought about identity-management on the internet and build the following figure:
your internet identity
It shows your identity as a person (including realname etc.) and connects different partial-identities to it.
A partial-identity is a subset of your whole identity-information. You create such subsets with nearly every service you use on the internet.
For example by using a social bookmark service, your partial-identity is the information about your preferred bookmarks.
Such subsets of your identity are not very delicate if you can’t connect them to your whole identity. If you are able to connect them, the information from the partial-identity become authentic. And thats a problem for your privacy.
So the best way to protect your identity is to avoid information which can connect the subsets among each other. And also avoid information which can directly map a subset to your identity. You can use for example different email-addresses for each service.

URIs for eternity

It is the the duty of a Webmaster to allocate URIs which you will be able to stand by in 2 years, in 20 years, in 200 years. This needs thought, and organization, and commitment.

see W3C’s “Cool URIs don’t change“.

Automatisierter Datenschutz mit P3P

Wer kennt es nicht? Man geht auf eine Webseite und muss dort persönliche Daten eingeben. Aber wer liest sich schon immer die Datenschutz (Privacy) Richtlinien der Seite durch und entscheidet dann aufgrund dessen was er an Informationen herausgibt? Richtig, fast niemand.
Aber wäre es nicht schön, wenn z.B. der Browser den Benutzer automatisch darauf hinweisen würde, was dieser am besten preisgeben sollte und was nicht?
Und genau hierfür braucht man standardisierte Angaben zu den Datenschutz-Richtlinien einer Webseite. So können diese automatisiert verarbeitet und interpretiert werden.
Hier setzt das “Platform for Privacy Preferences Project (P3P) vom W3C an und definiert das entsprechende Format für diese Angaben. Format ist XML und es gibt sogar ein RDF-Schema dafür.
Das werde ich auf jeden Fall mal weiterverfolgen.

Web 2.0, soziale Netze und der Datenschutz

Was hat man nicht alles in den letzten Monaten lesen koennen: Web 2.0 — das neue Web, unendliche Moeglichkeiten, die neue Generation des Internets usw.
Und ich muss gestehen, dass der ganze Hype einige schoene Ideen mit sich gebracht hat.

Doch in Mitten dieser Welt aus huebschen Kanten und Knoten, Bildern und persoenlichen Informationen, geraet der Datenschutz in Vergessenheit. Die Leute oeffnen ihr ganzes Leben der Internetgemeinde. Sei es nun, dass man alle seine Freunde und Bekannte preisgibt, seine Lieblingsplaetze auflistet oder den aktuellen Arbeitgeber bzw. damalige Arbeitgeber zur Verfuegung stellt.

In einem Umfeld in dem alle Nutzer ehrliche, nette Menschen sind und keiner die Daten missbrauchen moechte, ist das auch alles schoen und gut und kann u.U. sogar sinnvoll sein. Aber die Realitaet sieht anders aus.

Schauen wir uns doch mal eine Plattform an, die die sogenannte “Web2.0″-Technologie nutzt: Da haben wir zum Beispiel die Bewertungs-Plattform QYPE.com.

Hier suchen wir uns speziell einen fleissigen Benutzer wie z.B. Herrn U aus H. Was haben wir denn da alles?

  • Realname und natuerlich ein Bild
  • nun werden wahrheitsgemaess alle Lieblings-Locations angegeben. Dank Google-Maps haben wir auch gleich die passenden Koordinaten. Hieraus koennte man doch ein klasse Bewegungsprofil erstellen.
  • Da Herr U auch seinen Hausarzt und seinen Lieblingsbaecker fuers Wochenende angegeben hat, koennte man Rueckschluesse auf die Lage seiner Wohnung ziehen. Je mehr Anhaltspunkte man hat, desto mehr kann der Bereich eingegrenzt werden.
  • Durch Angabe von Autovertragswerkstaetten kann man sich ueberlegen welche Automarke der Herr faehrt.
  • Zudem sind noch reichlich Freunde in seinem Netz vorhanden. Viele auch mit realen Namen.
  • Es wird sogar die aktuelle Firma angegeben.
  • Wir erfahren, dass er einen kleinen Sohn hat, der gerne in den Zoo geht.

So geht das weiter und man kann ein schoenes Profil zusammenbekommen. Und das alles ohne viel Aufwand und auch gerne automatisiert.
Die oben genannte Bewertungsseite ist nur ein Beispiel fuer eine Plattform wo Benutzer ein schoenes Profil pflegen.
Andere Plattformen wie orkut (sexuelle Interessen, …) oder openBC (ex-firmen, geschaeftskontakte, …) gehen da noch viel weiter.

Alle Plattformen sind wirklich interessant und teilweise sinnvoll, aber der Benutzer sollte auf seine persoenlichen Daten doch mehr achten.

WordNet im Semantic Web Bereich

Ich beschaeftige mich seit kurzer Zeit mit WordNet — einer lexographischen Datenbank, die Woerter untereinander nach linguistischen Methoden in eine semantische Beziehung setzt.

Das ist ganz interessant und man lernt eine ganze Menge neuer Woerter kennen, von denen ich vorher noch nie etwas gehoert habe: Hyponym, Holonym, Hypernym, Meronym und so weiter. ;-) Diese Begriffe bezeichnen unterschiedliche Beziehungen, die Woerter untereinander haben koennen.

Nun gut, jetzt ueberlege ich schon die ganze Zeit, wie man das sinnvoll im Semantic Web Bereich verwenden kann. Matt Biddulph hat zum Beispiel vor einiger Zeit vorgeschlagen, dass man mit Hilfe von WordNet Bilder beschreiben kann. Wenn auf dem Bild beispielsweise ein Hund zu sehen ist, dann zieht man aus WordNet automatisch einige weitere Begriffe, welche als Metadaten fuer das Bild dienen (z.B. Tier, Raubtier, Koeter, …).

Die Idee finde ich ganz interessant und man kann sie ja auch noch erweitern. Zum Beispiel koennte man solche Metadaten fuer jede Art von Daten automatisch generieren lassen. Beispielsweise koennten Artikel, die ins Netz gestellt werden, nach Schlagworten durchsucht werden, die den Inhalt gut charakterisieren. Mit diesen Schlagworten koennte man dann WordNet “fuettern” und so automatisch z.B. Keywords erzeugen und diese mit auf der Seite speichern oder die Schluesselwoerter fuer eine Kategorisierung verwenden.

Ich denke, dass WordNet eine Menge interessanter Moeglichkeiten bietet. Ich werde mich auf jeden Fall noch weiter damit beschaeftigen und vielleicht kommt ja irgendwann mal ein Geistesblitz. :-)

Ideen fuer RDF im Web

Durch einen Artikel auf Builder.com habe ich ein wenig ueber moegliche, sinnvolle Anwendungsmoeglichkeiten von RDF im Web nachgedacht. Dabei fiel mir vor allem der Community-Bereich ein. Hier koennten die Profile der Benutzer mit Hilfe von RDF verwalten werden. Beispielsweise unter zu Hilfenahme des FOAF-Vokabulars waeren einige Dinge schon jetzt moeglich. Man denke z.B. an die Verwaltung von “Buddy-Listen” durch Einsatz der foaf:knows-Beziehung, etc. Zu jedem Nutzer koennte automatisch ein beliebig grosses semantisches Netz erzeugt werden, welches alle notwendigen Daten enthaelt und einfach erweitert werden kann. Vorteil hierbei ist unter anderem, dass das Profil durch RDF plattformunabhaengig wird und somit einfach unter Anwendungen ausgetauscht werden kann.

Ein weiterer Einsatz von RDF auf Web-Seiten waere die Speicherung von Beziehungen zwischen einzelnen Seiten. Der Artikel auf Builder.com behandelt nur die automatische Erzeugung normaler Sitemaps, wie sie auch heute schon im Einsatz sind. Man koennte aber auch komplett die Seitenstruktur durch RDF abbilden. Seiten koennten dann untereinander einfach verknuepft werden, wenn sie in irgendeiner Beziehung stehen. Diese Beziehungen koennten schnell erweitert werden und dem User werden diese “verwandten” Seiten dann als moegliche Ziele vorgeschlagen.
Wenn man noch weiter geht, koennte man diese Beziehungen abhaengig vom User machen und sie im Profil speichern. Dadurch koennte man einen hohen Grad an Personalisierung erreichen.