Perché non fai qualche prova ?
Perche' non l'ho mai usato, come faccio a sapere se e' la strada migliore? In ogni caso, avevo capito che lui voleva vedere i collegamenti "puliti" dopo la ricerca su Google, e forse potrebbe, senza usare dom
recuperare la pagina
aggiungere il necessario javascript in fondo alla pagina, sostituendo il </body> con il testo dello script piu' ancora </body>
ricaricare la pagina.
A quel punto, se prende il testo del controllo, ha gia' tutti i collegamenti.
Fai una prova per esempio con questo banalissimo file html
<!DOCTYPE html>
<html>
<head>
</head>
<body>
<a href='/posts/2008/01/20/check_mp3_for_hash_size.html'>Check Mp3 For Hash</a><br>
<a href='/posts/2008/03/22/convertire_wma_in_mp3.html'>Convertire Wma In Mp3</a><br>
<script>
if(document.getElementsByTagName) {
document.writeln(">>><br>")
for(i=0; i < document.getElementsByTagName("A").length; i++)
document.writeln(document.getElementsByTagName("A")[i]+"<br>");
}
</script>
</body>
</html>
Se gli fai stampare anche le righe per mettere i risultati in un div nascosto (basta aggiungerle allo script), nemmeno le vedi, ma con la proprieta' .text dovrebbe essere facile recuperare tutto.