Estas en: Home > Web

Entradas etiquetadas con Web

Scrapy: Framework en Phyton para obtener datos de la web (Instalación en Debian)

0

Desde hace unos años se viene produciendo una necesidad por recopilar la mayor cantidad de datos posible, procesarlos y analizarlos. Las herramientas comprendidas dentro del llamado Big Data permiten esto, aunque hay un pequeño sector que está creciendo en importancia: la obtención de datos desde otras web. No estoy hablando de APIs, sino de recopilar información del html que nos exponen otras páginas webs.

A la recopilación de esta información se le llama Web Scraping (http://es.wikipedia.org/wiki/Web_scraping), y está comprendido dentro de las técnicas de Minería de Datos (http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos) del Big Data (http://es.wikipedia.org/wiki/Big_data).

Scrapy nos permite realizar esta tarea de la forma más cómoda posible, aunque necesitarás conocimientos de Phyton para poder usarla.

En Debian su instalación es muy sencilla.

Primero es necesario asegurarnos que disponemos de las librerías adecuadas:

apt-get install phyton phyton-dev phyton-pip libxml2-dev libxslt-dev libffi-dev

En segundo lugar, instalamos Scrapy:

pip install scrapy

Una vez finalizado el proceso de instalación nos vamos al directorio donde tengamos nuestros proyectos de programación, y allí ejecutamos la siguiente línea en la consola:

scrapy startproject nombre_proyecto

Este comando nos creará el directorio del proyecto (nombre_proyecto) y todo el árbol de directorios y archivos necesarios para empezar.

BraiMy aplicación para la creación de eventos online busca financiación

0

 BraiMy (antes llamada Eventweet) es una aplicación basada en redes sociales y
concebida para la gestión de conocimiento social.

  • Permite compartir en tiempo real una información o conocimiento
    que se comenta por todos los participantes como si se tratara de una
    tormenta de ideas presencial.
  • Los asistentes aportan conocimiento vivo basado en su formación y
    experiencia personal, y aprueban o valoran las aportaciones de los
    demás añadiéndoles comentarios que las matizan.
  • Permite la interacción en tiempo real entre organizadores,
    invitados y participantes
  • Los eventos se realizan en un entorno social abierto que permite
    combinar las potencialidades de las redes sociales como Facebook o
    twitter.
  • BraiMy permite moderar los eventos evitando abusos amparados en
    el anonimato.
  • Los informes permiten conocer con datos cuantificados el estado
    real de la cuestión y tomar decisiones basadas en el.
  • Eventos e informes incluyen toda la información SEO necesaria
    para la correcta indexación y presencia en Internet de productos,
    marcas, entidades, empresas…
  • Todos, participantes y organizadores obtienen ventajas mensurables.

Nos presentamos para financiar su desarrollo, una gran aplicación para
una pequeña empresa. Ayúdanos a realizarla con tu voto, puedes votar
usando tu cuenta de Twitter o
Facebook Leer mas de BraiMy

Ayudanos a difundirlo: darle RT en Twitter danos tu Like en Facebook o reenviarlo a tus
amigos.

Jivago

Isogenic Engine: Motor para juegos 2D en javascript

0

Fantástico motor 2D para juegos basados en el navegador. No os contaré nada sobre el motor, hay que verlo: http://www.isogenicengine.com/

logo unidadesdemedida.com

unidadesdemedida.com: ¿Cuántas piscinas olímpicas es un campo de fútbol?

0

Desde hace bastante tiempo, los medios de comunicación han utilizado unidades de medida diferentes a las del Sistema Internacional (SI) para medir las nuevas infraestructuras o vehículos que el ser humano crea. Últimamente se ve incluso la utilización de unidades de medida especiales para el coste de los fichajes de deportistas, principalmente en el fútbol.

 

Para aquellos que desean saber cuántas piscinas olímpicas es un campo de fútbol entre otras unidades, no os perdáis mi nuevo proyecto que espero os guste aunque aun le quedan muchas unidades que añadir.

 

Cualquier sugerencia o crítica será bienvenida.

 

Link: http://www.unidadesdemedida.com

Optimizar el servidor web Apache

1

Tenía intención de crear un post explicando la optimización de Apache, pero la verdad es que en la red ya existe bastante información al respecto por tanto os dejo dos links, uno explicando cada uno de los parámetros que se pueden modificar en el archivo httpd.conf de Apache y el otro con algunos ejemplos de optimización:   – Definición de parámetros: http://www.codenb.com/optimizar-apache-16/ – Ejemplos: http://www.forosdelweb.com/f58/recetas-para-configuracion-apache-404961/

#libranda: Plataforma de distribución de ebooks… o algo así

3

Sí, porque ya al entrar en su web (libranda) lo primero que te encuentras son libros, cuando, siendo una plataforma de distribución digital, debería indicar la forma de poder insertar su catálogo en las webs interesadas, información que no aparece por ningún lado. Aunque puedo suponer, (y viendo que la web está realizada con asp.net) que muy probablemente utilicen bases de datos SQL Server y SO Windows en sus servidores, utilizando muy probablemente algún sistema parecido al que se utilizan en las pasarelas de pago de los bancos (utilizan un .exe) para realizar las comunicaciones con las tiendas. Aunque si han sido inteligentes utilizarán un sistema más simple que con enviar a libranda un código que identifique la tienda y el id, isbn, u otro código que identifique el artículo/s puedan ser descargados.

Como ya se ha comentado en los días posteriores a su lanzamiento, libranda tiene muchos fallos, no repetiré lo que otros ya han dicho sobre el DRM, que por cierto, ya se puede saltar; ni sobre la mala campaña de comunicación, ni sobre los pocos libros con los que ha salido al mercado, ni sobre los precios que las editoriales han puesto a algunos libros. Me gustaría darle un punto más técnico al artículo, intentando conocer (o más bien suponer) como funciona esta plataforma de distirbución y que problemas técnicos van a tener.

WEB

Libranda es una distribuidora de libros digitales y su web la zona que ofrece información sobre cómo se distribuyen esos libros, quienes pueden venderlos, las licencias que ofrecen, formatos disponibles, etc. Es decir, información sobre la plataforma de distribución, no sobre los libros; no al menos de una forma tan visible como está actualmente.

Siguiendo la idea anterior, la sección que muestra las tiendas no debería estar, probablemente ni existir, ya que el objetivo de la web no debe ser redireccionar usuarios, sino dar información a los libreros sobre el funcionamiento de la plataforma. Lo mismo ocurre con el catálogo de libros. Sí lo veo necesario que exista, para que cualquiera pueda consultarlo, pero no necesariamente tan visible, al menos no en la página principal.

La sección «¿Qués es Libranda?» sería la que pondría como página principal. Las novedades, no pintan nada donde estan, lo lógico es que esa información se comunicase a los libreros vía email, y ellos colocasen las novedades donde crean más conveniente en sus webs.

Como ya comento al principio del artículo, está creada con asp.net, con lo que muy probablemente el coste mensual o anual del servidor sea alto, ya que estarán pagando la licencia de Windows. Nunca entenderé este empeño de las grandes empresas de utilizar tecnologías de pago cuando con PHP tendría lo mismo mucho más barato.

DISEÑO

Me gusta. Así sin más, y si la comparamos con el portaldemusica.es de Promusicae, toda una obra de arte. Ahora bien, respecto a la cabecera, siempre que hablásemos de una tienda de venta de libros (o un blog de esta temática) estaría elegante (habría que ver el resto), pero no es el caso, por tanto me resulta demasiado grande para el cometido de la web, que es aportar información. Y tal vez destacar más las FAQs que están algo escondidas y será casi lo primero que se vaya a usar, sobre todo por los libreros. Incluso le cambiaría el nombre a «Ayuda» o «Preguntas frecuentes», ya que, los libreros dudo que estén habituados a este tipo de terminología.

Por lo que puedo ver dentro del código fuente de la página:

<meta name=»author» content=»Julio Rabadán» />
<meta name=»company» content=»Somms.NET» />

El diseño ha sido subcontratado a esta empresa: somms.net, y digo subcontratado porque ellos no han llevado el desarrollo de la plataforma.

PLATAFORMA DE DISTRIBUCIÓN

Por fin la parte entretenida. El meollo de la cuestión, La piedra Rossetta del proyecto. El I+D de las editoriales. Lo original… estoooo… no… original no mucho.

No es original porque es algo que ya existía, simplemente se han hecho algunos añadidos. Me explico:

La empresa contratada para crear la plataforma es Newcomlab,  que ya tenía creada la plataforma de distribución desde hace tiempo.

El sistema es el mismo con la excepción del formato de los archivos, antes utilizaban un sistema de Microsoft y ahora es de Adobe.

No me voy a extender ya que tanto en la web de libranda como en la de newcomlab se explica más o menos el funcionamiento global de la plataforma. Pero sí dejaré unos links que espero os resulte de interés:

Tenian hasta su propia tienda de ebooks, pero la cerraron, habría que saber porqué.

Algo que si me llama la atención de la actual forma de venta de ebooks con esta plataforma, es que el usuario no va a realizar la descarga directamente desde la web de su librero favorito, sino a través de un email que le enviará Libranda. Para mí, que me dedico al software, me produce una vergüenza ajena increiblemente grande. Es incomprensible que para descargar un puto libro tenga el usuario que dar tantas vueltas. Y encima de pago.

CONCLUSIÓN

Buen intento, pero mal marketing. El proyecto es interesante pero no se ha sabido llevar correctamente. Gran campaña de marketing para anunciar nada. Muy lentos digitalizando los libros, teniendolos ya en PDF se puede utilizar Calibre para pasarlos a ePUB, por ejemplo. DRM sin compatibilidad con ereaders antigüos, solo los más modernos pueden leerlo. Mala organización de la web, falta información o está mal indicada (Si conseguís que os de error el formulario de acceso de clientes decidmelo que no ha habido manera xD. Poco usable). Da la impresión de haber corrido demasiado para tenerla antes de la temporada escolar de septiembre y las vacaciones de agosto. Descarga del ebook muy engorrosa para el usuario. En fin, mucho tienen que mejorar para que a final de año la gente compre ebooks y no vaya a las webs gratuitas.

FUENTES Y LINKS DE ESTOS ÚLTIMOS DÍAS

Hitler ve el Ultimo capítulo de Lost / Hitler «se entera» del final de Lost (Perdidos) ¡Cuidado spoilers!

0

Symfony: Archivos de configuración

0

Bueno, sigo dandole caña a Symfony a través del manual en español, y después de practicar un poco con los conocimientos que he adquirido últimamente, puedo haceros un resumen de lo que os vais a encontrar.

(más…)

Mi primer ¡Hola Mundo! con Symfony

12

Ayer os mostré mi pequeña odisea para instalar Symfony en WAMP o al menos el SandBox, hoy toca empezar a programar.

Sigo con el libro en español de symfony.es. En el capítulo cuarto la cosa se empieza a poner interesante, voy a empezar a enrear con Symfony jejejeje.

(más…)

Instalar Symfony + WAMP

26

Una de las cosas más entretenidas de un programador (al menos para mí), es la de reciclarse cada poco tiempo para no quedarse estancado. Yo estoy en este proceso y después de varios días intentando instalar Symfony junto con WAMP al fin lo he conseguido (Sí, me ha costado un huevo, ¡que pasa! xD); para que otros desarrolladores no tengan que dedicarse a buscar información sobre como instalar Symfony junto a WAMP voy a explicar como realizarlo, los fallos que me ha dado, como solucionarlos, etc. Vamos allá.

(más…)

Ir arriba