События: Мастер-класс Андрея Скворцова в "Digital October"
0
Отчет с мастер-класса Андрея Скворцова в «Digital October» с видеозаписью уже готов.
28 марта в 19:30 в Digital October выступит Андрей Скворцов с мастер-классом об инфографике и искусстве представления данных в удобном и наглядном формате.
- Каковы общие приниципы составления инфографики?
- Нужна ли инфографика коммерческим компаниям?
- Какие проблемы можно решить с ее помощью?
- Как сделать хорошую инфографику, даже не умея рисовать?
- Как оценить качество профессиональной инфографики?
- Какой бывает инфографика, какие ее виды существуют?
- В чем особенности видео инфографики?
Кстати, по событиям в области инфографики есть отличная инфографика, сделанная авторами блога «Inforapher»
Этот пост был загружен 03-05-2012 из блога Инфографика в примерах. Оригинал находится здесь.
Точечная гистограмма в R (dotplot, ggplot2)
0В ggplot2 версии 0.9.0 добавился интересный вариант визуализации данных — dotplot. По сути это гистограмма, которая отражает напрямую количество наблюдений. Не знаю, как это по другому описать, просто взгляните на график:
Линиями отражено распределение плотности, «точками» — наблюдения. Шкала x — средняя точность ответов. Данные представлены для двух групп из одного из моих экспериментов. На графике четко видно, что в обеих группах есть люди, которые просто не прочитали инструкцию, или прочитали неправильно (точность 0.1 — правильный ответ на уровне шанса) =)
Делается такой график вполне просто:
> ggplot(data=art_ev_aggr,aes(x=accuracy)) + geom_density(aes(linetype=factor(target_time),y=..scaled..)) + geom_dotplot(dotsize = .5,aes(size=2, fill=factor(target_time))) + labs(fill="Target time", linetype="Target time")
Когнитивная психология и эмоции. Блог Андрея Четверикова, 2012. |
оригинал заметки
Метки: dotplot, ggplot2, R, визу, визуализация
Этот пост был загружен 25-03-2012 из блога Когнитивная психология и эмоции » R. Оригинал находится здесь.
Полиномиальная регрессия через функцию lm
0Работаю в R недавно, может этим фактом и вызван следующий вопрос, но хотелось бы узнать на него ответ для дальнейшего самосовершенствования.
В R есть большое количество способов построить модель полиномиальной регрессии, я обычно пользовался банальным:
fit <- lm(y~poly(x,2)…)
Но недавно мне понадобилось вывести полученную модель в виде стандартного уравнения полиномы второй степени:
y = c + b*x + a*x^2
Казалось бы все просто, пишем coef (fit) — вот нам и коэффициенты… Но тут и началось самое интересное, рассмотрим на примере.
Есть простая таблица data:
Опишем зависимость y от x, приняв за регрессионную модель полином второй степени. Воспользуемся двумя способами, которые обычно в литературе указываются как эквивалентные:
fit1 <- lm(y ~ poly(x, 2), data=data)
fit2 <- lm(y ~ x + I(x^2), data=data)
Для того, чтобы доказать эквивалентность моделей без математических ухищрений воспользуемся функцией predict, предварительно создав проверочную таблицу new.data:
Значения одинаковые, соответственно модели эквивалентны.
Теперь попытаемся записать математическую формулу полиномы, которая, как мне казалось, для fit1 и fit2 должна быть одинакова.
fit2 y = 3.139202e-01 + (3.382987e-03*x) + (-4.521997e-05*x^2)
Очевидно, что уравнение для fit1 дает неверный результат, в то время как уравнение для fit2 — верный… Или я где-то ошибся? Буду благодарен за разъяснения!
Этот пост был загружен 23-03-2012 из блога Язык и среда R. Оригинал находится здесь.
Ядерное сглаживание распределений
0Если возникает задача оценить распределение переменной в генеральной совокупности, а наблюдений не очень много, привычный инструмент — гистограмма — может давать не вполне удовлетворительный результат: на графике будут видны провалы и нерегулярные пики. Задачу моделирования гладкой кривой плотности распределения можно решить с помощью метода сглаживания ядерной функцией (kernel density estimation). Представьте, что гистограмма вместо отдельных «кубиков» будет строиться из мини-распределений заданной формы: треугольников, нормальных распределений и т.п. Суммируя все составляющие такой «гистограммы», мы и получим сглаженную кривую.
В R имеется функция density(), которая реализует ядерное сглаживание. Рассмотрим самый простой пример для двух наблюдений:
x <- c(3, 9)
d <- density(x)
plot(d)
Используемый по умолчанию способ сглаживания (не самый оптимальный, но оставленный по историческим причинам) даст бимодальное распределение. Функции можно передавать множество параметров, влияющих на характер и степень сглаживания. Один из параметров (bw) задает величину рассеивания в ядерной функции. Чем больше значение параметра, тем сильнее будет сглажена кривая (соответственно, детали теряются). Так, density(x, bw = 5) даст уже одномодальное нормальное распределение. Параметру можно передать и название метода определения оптимального интервала (скажем, метода Сниффера и Джонса, SJ).
Второй параметр, kernel, задает ядерную сглаживающую функцию: «gaussian», «epanechnikov», «rectangular», «triangular», «biweight», «cosine», «optcosine». Вот такой вызов построит распределение, составленное из двух треуголников: density(x, kernel = «triangular», bw=»SJ»)
Этот пост был загружен 23-03-2012 из блога Язык и среда R. Оригинал находится здесь.
Книги: Джон Маэда — Законы простоты
0Книга о дизайне, юзабилити и восприятии в целом. Рамками инфографики не ограничивается. Читайте и развивайте чувство минимализма.
10 законов для бизнеса, дизайна и жизни
Знания упрощают жизнь. Трудные задачи кажутся легче, если их «нужно знать», а не «хорошо бы знать».
Почему стоит прочесть книгу Джона Маэды «Законы простоты»?
![]() |
| Джон Маэда |
Главным образом для того, чтобы перестать каждый день усложнять свою жизнь! Читая такого рода книги, я каждый раз делал один и тот же вывод: Все истины можно перенести на события собственной жизни! Эта книга — не исключение.
Для того, чтобы понять: Не все старые вещи годятся только для того, чтобы пылиться в шкафу или на валяться на балконе. Любая вещь — предполагаемое творение искусства. Дайте ей новую жизнь: облеките ее в новую форму, добавьте эмоции и она будет стоит миллионы!
Для того, чтобы понять: Жизнь станет хоть немного идеальней, если вы перестанете все усложнять…
Надеюсь я вас убедил! Ну а выбирать — читать или не читать, уже вам…
Приобрести книгу Джона Маэды «Законы простоты» вы можете в интернет-магазине Ozon!
Этот пост был загружен 15-02-2012 из блога Инфографика в примерах. Оригинал находится здесь.
Про объём выборки
0Впал в некоторое затруднение — есть ли какие-то внятные математические (или иные) основания для определения размера выборки в случае применения ранжирования в целях многомерного шкалирования индивидуальных предпочтений?
Ну то есть я понимаю, что субъектов оценивания должно быть больше, чем объектов. Но вот сколько? Чтобы это отражало что-то, существующее в генеральной совокупности, допустим, "жители Санкт-Петербурга"?
Нутром чую, что это число явно меньше, чем в ситуации ответа на вопрос — "какой коньяк вы предпочитаете с утра" или "за Путина вы бы проголосовали в это воскресенье или в следующее?". Но вот почему оно меньше…
Видимо, всё-таки, проблема в том, что я не вполне понимаю, интервалы для чего могли бы быть критериями точности. Я же не вычисляю средние ранги…
UPD:
Для стандартной ситуации вроде бы есть некоторая принятая формула:

Допустим, я хочу получить средние ранги с точностью 0,5 при 5% уровне значимости. И ранжирую 10 объектов.
Правильно ли я понимаю, что за стандартное отклонение в этой ситуации можно будет принять что-то около 2,87 — т.е., стандартное отклонение множества множеств [1:10]?
И тогда в этой задаче получается
1,96^2 * 2,87^2 / 0,5^2, т.е. 127 человек?
Этот пост был загружен 15-02-2012 из блога SPSS в психологии и социальных науках. Оригинал находится здесь.
Дэшборд — красота или понятность?
0
В последнее время мы тратим достаточно много времени на отчётные дэшборды. Поделюсь с вами темии мыслями об эффективности выбора внешнего вида показателя, которые занимают мой мозг в последнее время.
Материалы по теме:
Работать c infographer? Ищем: аналитик-проектменеджер, иллюстратор, php/js-программист, SEO-специалист.
Хотите помогать нам? Ищем волонтёров в общественный infoпроект.
Copyright © 2009-2012, infographer.ru.
Все права защищены. |
Постоянная ссылка |
0 комментариев
Хотите узнать больше? Посмотреть все записи по темам cognos, выбор показателя, дэшборды, когнос, правила визуализации, софт для визуализации, спидометр, столбиковая диаграмма, термометр, элементарные визуализации.
Этот пост был загружен 14-02-2012 из блога Infographer » Российский сайт Инфографики.. Оригинал находится здесь.
Кружки кофе и качество сна
05 января 2012 года соорганизатор группы San Diego Quantified Self Эрнесто Рамирез поделился с читателями Quantified Self ссылкой на интересную заметку о частном исследовании. Автор исследования — Майкл Аллен Смит очень любит кофе и ведет блог I Need Coffee. В течение года Майкл учитывал количество и время потребления кофе. Также Смит оценивал по пятибалльной шкале качество своего сна. Имея под рукой Fitbit Ultra и питая слабость к кофе, я также не удержался от проведения подобного эксперимента.

Как и Майкла Аллена Смита меня интересует влияние кофе на сон. Я не хочу потреблять много кофе, так как согласно расхожему мнению кофеин влияет на качество сна. Но кофе такое вкусное, что иногда удержаться очень сложно. Нужно ли ограничивать себя и в какой степени? На эти два вопроса я хочу получить ответ.
В ходе эксперимента учитывается количество выпитых кружек кофе до обеда и после обеда. Данные по каждому дню заносятся в GoogleDocs Spreadshit (параметр tCoffee), а затем туда же добавляется информация об эффективности ночного сна (Efficiency), времени на засыпание (Fall — time to fall asleep), количество пробуждений (Awoke — times awakened). Майкл Смит проводит оценку сна по пятибалльной шкале. В моих же отчетах по сну учитываются данные Fitbit Ultra.
Заметка Аллена Смита о влиянии кофе на сон | Проникшийся энтузиазмом Алексей Мельников 
bar chart, fitbit ultra, корреляция, кофе, самонаблюдение, сон, статистика
Этот пост был загружен 13-02-2012 из блога VizualData.ru, заметки с тегом: статистика. Оригинал находится здесь.
R для серверного программирования
0Похоже, этого тут еще не было.
Наткнулся на интерфейс SSSR (former RWeb), позволяющий использовать R для server side scripting.
Если кто пользовался или соберется попробовать, делитесь впечатлениями.
Этот пост был загружен 13-02-2012 из блога Язык и среда R. Оригинал находится здесь.
регрессионный анализ
0Здравствуйте!
Подскажите, пожалуйста, в регрессонном анализе нужно выбирать метода "Исключение" или "Шаговый отбор"?
Спасибо заранее
Этот пост был загружен 12-02-2012 из блога SPSS в психологии и социальных науках. Оригинал находится здесь.



