From 2538fa1da3ce86bdc882e0dccc4b10c68f87dc92 Mon Sep 17 00:00:00 2001 From: Juanjo Date: Thu, 31 Oct 2024 19:55:21 +0100 Subject: [PATCH] readme --- README.md | 12 +++++++++++- 1 file changed, 11 insertions(+), 1 deletion(-) diff --git a/README.md b/README.md index 021a922..4329ff6 100644 --- a/README.md +++ b/README.md @@ -6,4 +6,14 @@ - git commit -m "first commit" - git remote add origin https://git.ieslamar.org/gitea/thread4.git - git push -u origin main -## PRUEBA + +## Objetivo del programa +- Simular el funcionamiento de un rastreador web (bot crawler) + +## Estrategia +- Al programa se le pasa la URL inicial + - Guardamos el contenido de la página en un fichero + - Buscamos enlaces + - Guardamos el enlace en base de datos + - Volvemos a lanzar la URL encontrada + - Se repite hasta que no haya más enlaces