Re: [CBLX] wget

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Bonjour,


Si je peux mettre mon grain de sel : on n'accédera pas à plus
de données avec wget que celle auxquelles on accède avec un
brouteur. Pour la bonne raison que (sauf bêtise de ma part)
wget adresse des requête get au serveur http et analyse
quand-même peut-être quelques pages. Normalement sur un site le
code php n'est pas visible puisque le serveur sert du html à
partir de ce code donc aucun espoir (et c'est tant mieux comme
dit Jérémy) de récupérer ça. 

Autre détail. L'arborescence qui a été choisie pour ranger les
fichiers constituant le site http n'a de rapport que celui que
l'on veut bien lui donner avec lorganisation logique des page
html elles-mêmes. Autrement dit rien n'est obligatoire et
surtout cette arborescence n'apparaît pas dans la structure
logique du site (même si on peut la reconstituer grâce aux
liens) . Or il n'y a en définitive que cette structure logique
qui soit apparente à travers le serveur http. Autrement dit un
fichier qui n'est pas, soit de manière directe, soit de manière
récursive, référencé par un lien à partir du fichier sur lequel
on fait le wget ne sera pas récupéré.

Pierre

From: prego jérémy <jeremy@xxxxxxxxxxxxxxxxx>
Subject: Re: [CBLX] wget
Date: Tue, 18 Mar 2014 19:42:16 +0100

> 
> 
> Le 18/03/2014 19:40, Aldo a écrit :
>> Bonsoir Erwin,
>>
>> On Tue, Mar 18, 2014 at 04:11:14PM +0100, erwin wrote:
>>    
>>> Le Tue, 18 Mar 2014 15:54:32 +0100
>>> Aldo<info@xxxxxxxxxxxx>  écrivait:
>>>
>>>      
>>>> quelles options hormis -m pourrais-je ajouter à wget pour
>>>> récupérer en
>>>> profondeur ?
>>>>        
>>> trouvé cela sur un forum ubuntu
>>> (http://forum.ubuntu-fr.org/viewtopic.php?id=21805) :
>>>
>>> wget -r -k -np AdresseDeLaPage
>>>
>>> l'option -r signifie que le téléchargement sera récursif (il
>>> télécharge aussi les liens de la page)
>>> le -k permet de reconstituer le site localement (les liens sont
>>> modifié pour pointer localement)
>>> le -np empêche de remonter dans le répertoire parent.
>>>      
>> ça fonctionne pas mal, mieux qu'avec mon -m mais je suis loin
>> de tout
>> rapatrier;
>> j'ai demandé à l'intéressée de tenter de son côté de retrouver
>> les infos
>> pour accéder par ftp;
>>    
> 
> ça sera plus sure
> 
>> les compteurs en php par ex., ça je ne les récupère pas avec
>> wget, ni les
>> scripts en php que j'avais mis dnas misc/,
> 
> heureusement ! :)
> 
> 
> jerem
>> donc j'espère pouvoir réaccéder
>> en ftp si on a un peu de chance!
>>
>> Merci en tout cas.
>>
>> Aldo.
>>
>>
>>    
> 
> -- 
> 
>   CarrefourBLinuX MailingListe Pour obtenir de l'aide, envoyez le
>   sujet help à: carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>   Archives:
>   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> 

-- 

   CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  à: 
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/