04-threads/Scraping.py

import requests
from bs4 import BeautifulSoup

def extraer_enlaces(url):
    try:
        # Hacer una solicitud HTTP GET a la URL
        respuesta = requests.get(url)

        # Verificar si la solicitud fue exitosa (código 200)
        if respuesta.status_code == 200:
            # Guardar el contenido HTML en una variable
            contenido_html = respuesta.text

            # Usar BeautifulSoup para analizar el HTML
            soup = BeautifulSoup(contenido_html, 'html.parser')

            # Extraer todos los enlaces (elementos <a>)
            enlaces = []
            for enlace in soup.find_all('a', href=True):  # Buscamos todas las etiquetas <a> con el atributo href
                enlaces.append(enlace['href'])  # Guardar solo el valor del atributo href (el enlace)

            # Devolver la lista de enlaces
            return enlaces
        else:
            print(f"Error al acceder a la URL: {respuesta.status_code}")
            return []

    except requests.exceptions.RequestException as e:
        print(f"Error durante la solicitud HTTP: {e}")
        return []

# Ejemplo de uso
url = 'https://example.com'  # Cambia esto por la URL de la que quieras extraer enlaces
enlaces_encontrados = extraer_enlaces(url)

if enlaces_encontrados:
    print("Enlaces encontrados:")
    for enlace in enlaces_encontrados:
        print(enlace)
else:
    print("No se encontraron enlaces o hubo un problema.")