Skip to content

Instantly share code, notes, and snippets.

@clintongormley
clintongormley / gist:3888120
Created October 14, 2012 09:44
Upgrading a running elasticsearch cluster

Yesterday I upgraded our running elasticsearch cluster on a site which serves a few million search requests a day, with zero downtime. I've been asked to describe the process, hence this blogpost.

To make it more complicated, the cluster was running elasticsearch version 0.17.8 (released 6 Oct 2011) and I upgraded it to the latest 0.19.10. There have been 21 releases between those two versions, with a lot of functional changes, so I needed to be ready to roll back if necessary.

Our setup:

  • elasticsearch

We run elasticsearch on two biggish boxes: 16 cores plus 32GB of RAM. All indices have 1 replica, so all data is stored on both boxes (about 45GB of data). The primary data for our main indices is also stored in our database. We have a few other indices whose data is stored only in elasticsearch, but are updated once daily only. Finally, we store our sessions in elasticsearch, but active sessions are cached in memcached.

@peio
peio / opendata-pub-reccomendations.bg.md
Created June 19, 2012 17:06
Препоръки за публикуване на отворени правителствени данни

Препоръки за публикуване на отворени правителствени данни

Формати

Най-бързият и лесен начин да се направят определени данни достъпни онлайн е да се публикуват в суровия "изходен" формат (примерно XML файловете с имотните декларации на лицата, заемащи висши държавни длъжности). Важно е данните да бъдат добре структурирани. Структурата позволява автоматизирания достъп и обработка на данните. Добре познати и разпространени формати за структуриране на данни са XML, RDF и CSV. Файлови формати, които позволяват на данните да бъдат видяни, без да бъдат извлечени и обработени (примерно изображения на документи), не са използваеми и следва да бъдат избягвани.

Каталог

Създайте онлайн каталог на достъпните данни, който да позволи на хората лесно да откриват достъпната информация. Данните следва да бъдат добре описани и документирани, защото в противен случай тяхната използваемост би била минимална. Популярните методи за съхранение в Excel, Word, PDF и други двоични формати следва да бъдат избягвани.

@canburak
canburak / ga.py
Last active February 13, 2021 23:26
blog post: Push data to Google Analytics with Python: https://medium.com/p/pushing-data-to-google-analytics-with-python-80eb9691d61f
"""
Simple proof of concept code to push data to Google Analytics.
Related blog post:
* https://medium.com/python-programming-language/80eb9691d61f
"""
from random import randint
from urllib import urlencode
from urllib2 import urlopen
from urlparse import urlunparse