shoorick

Странности творятся. Почитав мануал, обращаюсь к друпаловой БД, ищу дубликаты адресов в таблице с 7500 строками:

SELECT `alias`
FROM `PREFIX_url_alias`
GROUP BY `language`, `alias`
HAVING COUNT(*)>1;

MySQL достаточно резво выдаёт ответ из почти семи десятков строк. Делаю запрос с подзапросом, чтоб выбрать номера узлов с найденными на предыдущем шаге дублями:

SELECT `source`
FROM `PREFIX_url_alias`
WHERE `alias` IN (
    SELECT `alias`
    FROM `PREFIX_url_alias`
    GROUP BY `language`, `alias`
    HAVING COUNT(*)>1
);

В итоге MySQL тяжко задумывается — вот уж 20 минут непонятно, что делает. Посмотрел SHOW CREATE TABLE — по полю `alias` строится индекс. Чё ему ещё надо-то?

P. S. Понятно, что я могу найденное на первом шаге тупо перебрать в цикле, написав какой-нибудь перлоскрипт, однако хочется сделать как-то изящнее.

Flat | Top-Level Comments Only

From:

anspa.livejournal.com

mysql известно тормозит на перекрестных запросах (по экспоненте с ростом количества записей в исходных таблицах).

можно сделать temp table, выбрав туда ключи дубликатов. и уже из той таблицы попробовать сделать alias in (select ...

в обеих таблицах (временной и исходной) ключевое поле (alias) должны быть проиндексированы.

slach.livejournal.com

вот это кстати дельный совет, реально =)

S	M	T	W	T	F	S
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Майэскьюэль не понял подзапроса

Майэскьюэль не понял подзапроса

no subject

no subject

Profile

December 2016

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags