Щебеночно-мастичный асфальтобетон ЩМА-15
Мы предлагаем широкий ассортимент товаров для проведения качественного строительства дорог с применением технологии, согласно мировым стандартам и требованиям. Один из таких материалов – щебеночно-мастичный асфальтобетон ЩМА-15. Он представляет собой горячую смесь вязкого асфальта и щебенки, основным ее компонентом является именно щебень. Также он включает в себя добавление таких материалов, как битум, песок и минеральный порошок.
ЩМА-15 Вы можете приобрести в «ДСК» с доставкой или под самовывоз, цена указана в нашем каталоге товаров. Купить смесь у нас можно в неограниченном количестве, стоимость её значительно ниже, чем у других производителей.
Основные достоинства и область применения
Укладку асфальта с помощью ЩМА-15 следует производить согласно характеристикам данного материала. Преимущества материала:
- Создается прочный каркас в слое дорожного покрытия, что скажется на долговечности использования дорожного покрытия.
- Повышается стойкость к смещению дорожного покрытия за счет сил внутреннего трения.
- Достигается нужная шероховатость покрытия и улучшается сцепление автоколес с дорогой за счет наличия большого количества крупного бетонного материала в асфальтной смеси.
- Создается препятствие для проникновения влаги вовнутрь слоя покрытия за счет повышенного количества содержания битума.
- Повышается стойкость к усталостному старению покрытия, образованию микротрещин, и как следствие увеличивается период эксплуатации дорожного полотна.
- ЩМА-15 используется при строительстве или ремонте верхнего шара поверхности автодорог для повышения их износостойкости и продления сроков службы.
Заказ щебеночно-мастичный асфальтобетон ЩМА-15
Наша компания реализует самые качественные материалы для строительства и ремонта автодорог в Москве и Московской области, причем цена за куб материалов действительно низкая для региона.
Звоните по телефону , и мы доставим продукцию в указанные сроки с соблюдением всех требований к технологии транспортировки и хранения.
Щебеночно мастичный асфальтобетон типы состав
Вопрос первый: какие разновидности асфальтобетона существуют?
- Асфальтобетон
- — бетон, в котором вяжущим материалом служит асфальт, а крупными составляющими — песок и щебень (или гравий).
Асфальтобетон приготавливают в специальных установках — асфальтосмесителях. Различают горячий (содержащий вязкий битум и укладываемый в горячем состоянии) и холодный — содержащий жидкий битум и укладываемый после охлаждения.
Разновидностью горячего асфальтобетона является литой (укладываемый без уплотнения), а также грунтасфальт (смесь грунта с битумом).
Асфальтобетон широко применяется для устройства покрытий автомобильных дорог, аэродромов и т. д.
- Сегодня асфальтобетон является одним из самых затребованных стройматериалов и такие его разновидности, как плотный, горячий, щебеночно-мастичный асфальтобетон, в частности.
- Особенно стоит отметить обширную классификацию этого материала. К примеру, мелкозернистый асфальтобетон тип б марка 1 представляет собой стройматериал, с размером зерен до 20 миллиметров, содержанием от 40 до 60% щебня, в основе которого лежат металлургические шлаки или карбонатные тонкоизмельченные горные породы.
Вопрос второй: расскажите о маркировке асфальтобетона, к примеру, что представляет собой щебеночно-мастичный асфальтобетон щма-15?
- Щебеночно-мастичный асфальтобетон – это асфальтобетонная смесь, которая характеризуется такими выдающимися эксплуатационными характеристиками, как водонепроницаемость, сдвигоустойчивость. Кроме того, с ее помощью легко можно создать шероховатое покрытие.
- Что же касается того, что представляет собой непосредственно щебеночно-мастичный асфальтобетон щма-15, то это асфальтобетонная смесь с приведенными выше характеристиками, которая содержит от 65 до 75 % щебня и имеет фракции размером в 5-15 миллиметров.
Вопрос третий: чем отличается крупнозернистый асфальтобетон?
- Асфальтобетон принято делить по размеру зерна на песчаный, крупнозернистый и мелкозернистый. При этом крупнозернистый асфальтобетон имеет размер зерен до 40 миллиметров.
Вопрос четвертый: что представляет собой укладка асфальта?
- Под термином «укладка асфальта» сегодня принято понимать процесс покрытия полотна дороги особым веществом – асфальтом, который может быть как естественным, так и искусственным. Традиционно в этом процессе непосредственное участие принимает специализированная дорожная техника – асфальтоукладчик.
- Сегодня выделяют два способа укладки асфальта – так называемый холодный и горячий.
- Традиционно этому процессу предшествует другой, не менее важный этап работ – покупка, а затем доставка асфальта.
Вопрос пятый: чем отличается асфальт от асфальтобетона?
- Под термином «асфальт» сегодня принято понимать особую смесь битумов, которую используют для создания дорожного покрытия, а также как гидро- и электроизоляционный, кровельный материал.
- Асфальт может иметь как искусственное, так и природное происхождение. А вот асфальтобетон (также весьма распространенный сегодня строительный материал) бывает только искусственным. Получают его при уплотнении асфальтобетонных смесей, применяют – примерно так же, как и асфальт.
Стабилизирующая добавка для щебеночно-мастичной асфальтобетонной смеси
Изобретение относится к области производства и применения стабилизирующих добавок для щебеночно-мастичных асфальтобетонных смесей, используемых для дорожных покрытий.
Известна стабилизирующая добавка для щебеночно-мастичных асфальтобетонных смесей, включающая природный волокнистый структурообразователь и битум, где в качестве структурообразователя берут средневолокнистую гумусобитумную фракцию из сухого измельченного торфа с добавлением адгезионной присадки (см. Патент РФ №2479524, МКИ С04В 26/26, С08L 95/00, опубл. 2013 г.).
Однако торф, используемый для приготовления добавки, представляет собой малоэффективное для качественной стабилизации асфальтобетонной смеси волокно, а адгезионная присадка может снизить термостабильность самой добавки. Нестабильность свойств целлюлозного волокна может привести к сегрегации ЩМАС и появлению битумных пятен.
Известна стабилизирующая добавка для щебеночно-мастичной асфальтобетонной смеси и способ ее получения, включающая битум, предварительно обработанную льняную солому и реагент Неозон Д (см. Патент РФ №2312116, МКИ C08L 95/00, С04В 26/25, опубл. 2007 г.)
Известная добавка обладает недостаточно стабильными свойствами ввиду отсутствия промышленного освоения волокон из данного вида сырья. Также применение в качестве связующего компонента битума реагента Неозон Д может отрицательно повлиять на свойства битума.
Наиболее близким по технической сущности и достигаемому эффекту является стабилизирующая добавка для щебеночно-мастичной асфальтобетонной смеси, включающая в масс. %: 80-85 целлюлозное волокно, 10-15 кубовый остаток масложирового производства, 0,4-0,8 гидроксид натрия и вода-остальное (см. Патент РФ №2458950, МКИ С08L 95/00, опубл. 2012 г.).
Данная стабилизирующая добавка будет гигроскопична и легко разрушаться под воздействием атмосферной влаги. Также недостатком является сложный процесс
получения данной добавки с большим водооборотом и металлоемким производством. Предложенная нами добавка гидрофобна к влаге, а гидрофобизирующий агент на целлюлозном волокне будет выступать в качестве модификатора битума. Используемое нами целлюлозное волокно обладает развитой поверхностью и большой сорбционной емкостью, что позволяет эффективно стабилизировать смесь от сегрегации.
Задачей изобретения является разработка стабилизирующей добавки для щебеночно-мастичной асфальтобетонной смеси, позволяющей эффективно стабилизировать щебеночно-мастичную асфальтобетонную смесь, улучшить эксплуатационные свойства вяжущего за счет образования внутреннего коагуляционного каркаса в битуме, увеличить адгезию битума к поверхности минерального материала и качественно повысить физико-механические характеристики щебеночно-мастичного асфальтобетона.
Поставленная задача решается путем создания стабилизирующей добавки для щебеночно-мастичной асфальтобетонной смеси в виде гранул, включающей целлюлозное волокно и продукт взаимодействия высших карбоновых кислот с полиэтиленполиамином и органическим растворителем, при следующем соотношении компонентов, масс.
Для получения стабилизирующей добавки в качестве целлюлозного волокна берут, например, целлюлозу сульфатную небеленую хвойную по СТО 05711131-015-2009 или по ТУ 5411-098-00279410-2007, целлюлозу беленую хвойную по ГОСТ 9571-89, полуцеллюлозное волокно по ТУ 5411-356-05765670-2009, целлюлозу беленую лиственную по ГОСТ 28172-89, целлюлозно-бумажные отходы по ГОСТ 10700-97.
В качестве высших карбоновых кислот берут, например, олеиновую кислоту марки Б14 и ОМ по ГОСТ 7580, олеиновую кислоту техническую по ТУ 020-700-7-91, жировую композицию по ТУ 9147-137-00336562-2008, флотогудрон по ТУ 9147-146-00336562-2008.
Для получения продукта взаимодействия используют низкомолекулярные полиэтиленполиамины (ПЭПА), например тетраэтиленпентамин (ТЭПА), пентаэтиленгексамин (ПЭГА), гексаэтиленгептамин (ГЭГА), диэтилентриамин
(ДЭТА) или их смесь — ПЭПА марки А по ТУ 2413-357-00208-447-99, ПЭПА марки Б по ТУ 6-02-594-85, ПЭПА по ТУ 2413-214-00203312-2002.
В качестве органического растворителя берут, например, толуол нефтяной по ГОСТ 14710-78, толуол по ГОСТ 5789-78, толуол каменноугольный по ГОСТ 9880-76, сольвент нефтяной Нефрас — А 130-150 по ГОСТ 10214-78, Нефрас — С4 150-200 по ТУ 38.1011026-85, Нефрас — С4 155-200 по ГОСТ 3134-78, этилбензольную фракцию (ЭБФ) по ТУ 6-01-10-37-78, ксилол нефтяной по ГОСТ 9410-78.
Для получения продукта взаимодействия в лабораторных условиях расчетное количество полиэтиленполиамина смешивают с расчетным количеством высших карбоновых кислот и расчетным количеством органического растворителя. Температуру реакции повышают до 200-220°С с одновременным удалением реакционной воды.
Стабилизирующую добавку готовят обработкой разволокненной целлюлозы с предварительно полученным продуктом взаимодействия с последующим гранулированием добавки с помощью механического пресс-гранулятора с периодическим дозированием добавки в питательную шнековую зону аппарата через штуцер с водяным паром и последующим гранулированием.
Приводим конкретные примеры приготовления продукта взаимодействия. Для приготовления продукта взаимодействия исходные реагенты берут при следующем соотношении компонентов, масс. %: 30-60 высших карбоновых кислот, 5-15 ПЭПА и 35-60 органического растворителя.
В реакционную двухгорлую колбу, емкостью 0.5 л, снабженную насадкой Дина-Старка, обратным холодильником, термометром, помещают 10,0 г ПЭПА, добавляют 45,0 г флотогудрона, 45,0 г толуола. Затем реакционную смесь доводят до кипения и кипятят до полного прекращения азеотропного выделения образовавшейся реакционной воды. Время реакции 6 часов. Затем температуру постепенно повышают до 200-220°С и синтез ведут в течение 2 часов. При этом из реакционной смеси удаляют реакционную воду. Продукт взаимодействия представляет собой вязкую массу коричневого цвета (см. табл. 1, пример 1).
Примеры 2-5 готовят аналогичным способом, изменяя виды реагентов и их количества.
Качество заявляемой стабилизирующей добавки оценивают на ЩМА — 15. Стабилизирующую добавку в ЩМА вводят в количестве 0,3-0,5 масс. % сверх 100% смеси минеральных компонентов с помощью линии пневмотранспорта в смеситель для приготовления ЩМА в гранулированном виде. В процессе сухого перемешивания с минеральным компонентом стабилизирующая добавка равномерно распределяется в смеси, после чего в смесь подают битум. Адсорбированный на поверхности целлюлозного волокна продукт взаимодействия активирует минеральный компонент, который при контакте с битумом увеличивает адгезию и качество дорожного покрытия.
В таблице 2 приведены содержание компонентов и физико-химические характеристики стабилизирующей добавки.
В таблице 3 приведен расход материалов для приготовления щебеночно-мастичной асфальтобетонной смеси ЩМА-15.
В таблице 4 приведены физико-механические характеристики ЩМА-15, приготовленных с заявляемой стабилизирующей добавкой (СД), состав которой приведен в примере 1 таблица 2 в количестве 0,3, 0,4 и 0,5 масс. % и добавкой по прототипу.
Исходя из полученных результатов исследований щебеночно-мастичная асфальтобетонная смесь в композиции с разработанной нами стабилизирующей добавкой с концентрацией от 0,3% до 0,5% удовлетворяет требованиям ГОСТ 31015-2002. Из анализа таблицы видно, улучшение показателя водонасыщения до 30% по сравнению с прототипом, которое возникает вследствие увеличения сцепления вяжущего с поверхностью каменного материала из-за наличия в составе стабилизирующей добавки продукта взаимодействия, проявляющего свойства поверхностно-активного вещества. Проникновение воды внутрь дорожного покрытия — одна из главных причин его разрушения, поскольку увлажненное покрытие неизменно приводит к потере прочности. Так как продукт взаимодействия в составе комплексной добавки помимо того, что модифицирует битум, является и адгезионной добавкой, что позволяет легче смачивать поверхность минерального материала и увеличивать сцепление битума с поверхностью щебня. Прочная адгезия зерен щебня препятствует проникновению воды в граничную область фаз, что, несомненно, увеличит долговечность покрытия. Сцепление также зависит от когезионной прочности битумных пленок и их адгезии к поверхности минерального материала. Вследствие этого и возрастает показатель водонасыщения и длительной водостойкости.
Показатель трещиностойкости зависит от способности ЩМА работать в пределе области обратимых деформаций, в процессе эксплуатации также зависит от многих факторов: водной среды, циклов замораживания — оттаивания, старение асфальтобетона которые ведут к изменению физико-механических свойств асфальтобетона. Для добавок СД-1, СД-2, СД-3 этот показатель, как и коэффициент внутреннего трения схож с показателем ЩМА с добавкой прототипа.
Предел прочности при температуре 20°С и 50°С отражает условие работы асфальтобетона в покрытии в теплый период года, и характеризует препятствие к образованию пластических деформаций. Увеличение данного показателя для температуры 20° почти в 2 раза и 50°С до 87% свидетельствует об увеличение теплостойкости покрытия, повышенной прочности композиционного материала ЩМА с добавками СД-1, СД-2, СД-3 и увеличение интервала температурной пластичности, который позволит эксплуатировать покрытие в широком диапазоне температур.
Сдвигоустойчивость ЩМА характеризует степень взаимодействия минеральных материалов с битумом. Сцепление при сдвиге при температуре 50°С у образцов ЩМА с добавкой СД-1, СД-2, СД-3 выше на 21% и 28% соответственно, чем у ЩМА с добавкой прототипа. В результате увеличения коэффициента внутреннего трения и сцепления при сдвиге повышается сдвигоустойчивость покрытия во время эксплуатации в период высоких температур окружающей среды. Это во многом возникает из-за увеличения давления в порах асфальтобетона, в результате чего снижается сдвигоустойчивость и появление в ходе чередования морозов и оттепелей трещин.
Из таблицы 4 можно сделать вывод, что заявляемая нами добавка удовлетворяет требованиям ГОСТ 31015-2002 по показателю стекания вяжущего. Добавки СД-1, СД-2, СД-3, состоящие из 85 — 90% целлюлозного волокна и 10-15% связующего компонента, показывают лучший результат — на 60% ниже прототипа, так как на стекание вяжущего влияет в основном природа целлюлозного волокна.
Таким образом, предлагаемая нами стабилизирующая добавка для щебеночно-мастичной асфальтобетонной смеси по показателям в соответствии с ГОСТ 31015-2002 превосходит известную добавку и расширяет арсенал средств в области стабилизаторов ЩМА.
Что такое схема? Как мы можем помочь студентам в его создании? (Мнение)
Сегодняшний гостевой пост написан Джули Стерн, автором и консультантом, специализирующимся на концептуальном понимании.
Вы когда-нибудь расстраивались из-за того, как быстро студенты забывают то, чему вы их учили? Или их попытками использовать то, что они узнали в одном контексте, в новом, но связанном контексте? Когда мы намеренно помогаем студентам построить схему, мы можем решить обе проблемы.
Схема — это ментальная структура, которая помогает нам понять, как все работает. Это связано с тем, как мы организуем знания. Получая новую информацию, мы связываем ее с другими вещами, которые мы знаем, верим или пережили. И эти связи образуют в мозгу некую структуру.
Рассмотрим следующие цитаты исследователей образования:
«Причина, по которой эксперты запоминают больше, заключается в том, что новички видят отдельные фрагменты информации, а эксперты — организованные наборы идей.«Донован и Брансфорд, 2005 г.
« Оказывается, хорошо разбираются в математике люди, которые устанавливают связи и рассматривают математику как связанный предмет ». Джо Булер, 2014 г.
«Ученые-когнитивисты думают о глубоком обучении — или о том, что вы могли бы назвать« обучением для понимания », — как способность организовывать отдельные фрагменты знаний в более широкую схему понимания». Meta & Fine, 2019
Если признаком опыта является организованное мышление, как мы можем помочь студентам увидеть структуру предмета, который мы преподаем?
Войдите в картотеку дворян. Этот низкотехнологичный инструмент способен произвести революцию в вашей педагогической практике. Клейкие заметки тоже работают. Они позволяют студентам физически строить схему и управлять ею в процессе обучения. Позволь мне показать тебе.
Сначала мы начнем с отдельных концепций, которые являются строительными блоками схемы. Понятия — это слова, которые мы используем для организации и категоризации нашего мира. Когда мы смотрим на стандарты нашей учебной программы или результаты обучения, существительные обычно являются концепциями. Примеры включают: сюжетные паттерны, характер, дробь, целое число, живые существа, органеллы, лидерство и суверенитет.
Мы можем начать с примеров понятий, которые учащиеся уже знают. Например, мы можем использовать океан, пустыню и тропический лес в качестве примеров концепции среды обитания. Или мы можем поставить перед учащимися группы различных концепций и попросить их попытаться определить особенности, которые различаются между группами. Один учитель естествознания в средней школе положил несколько простых схем на один стол и несколько параллельных схем на другой стол. Студенты поиграли со схемами на каждом столе и обсудили, какие различия они заметили между двумя группами.
Как только учащиеся начнут понимать концепцию, пора закрепить свое понимание (Fisher, Frey & Hattie, 2017). Они могут делать это с помощью учетных карточек, собирая эти карточки как визуальные представления строительных блоков опыта. Многие учителя используют модель SEE-IT. См. Шаги на Рисунке 1 ниже.
Рисунок 1: Модель SEE-IT для консолидации понимания отдельных концепций
Источник: адаптировано из Stern et.al, 2017; первоначально адаптировано из книги Paul & Elder, 2013.
Учитель социальных наук Джефф Филлипс попросил своих учеников выполнить это задание, чтобы закрепить их понимание концепции «услуг». А учитель английского и языковых искусств Тревор Алео попросил своих учеников завершить шаги с помощью концепции «символа». См. Оба примера студентов на рисунке 2 ниже.
Рис. 2: Примеры карточек SEE-IT для социальных исследований и лингвистических искусств
Когда учащиеся уточняют свое понимание концепций, это дает возможность исправить любые давние недоразумения.См. Пример ученика на Рисунке 3 ниже. Обратите внимание, что студент написал, что лидер имеет «право» изменить точку зрения общества, демонстрируя распространенную заблуждение в социальных исследованиях. В демократическом обществе власть имеет власть, исходящую от народа, в то время как люди сохраняют права, полученные от рождения. Это важное различие, которое мы теперь можем исправить.
Рисунок 3: Пример неправильного представления концепции
А теперь перейдем к действительно хорошему. После того, как учащиеся усвоили, исправили и закрепили свое понимание отдельных концепций, пора связать эти концепции во взаимосвязи. Вот где строится схема.
Этот следующий шаг происходит во время и после того, как учащиеся изучат богатый фактами контекст, такой как сложная математическая задача, научный эксперимент, художественный текст или контекст социальных исследований. Студенты используют свой учебный опыт, чтобы обобщить принципы организации того, как устроен мир (Erickson & Lanning, 2014).Теперь они могут физически расположить карточки для заметок или стикеры, чтобы продемонстрировать взаимосвязь между концепциями. Затем они должны написать предложение или абзац, объясняющий отношения.
Учитель естественных наук Джулия Бриггс попросила своих учеников соединить понятия материи, устройства, субатомных частиц и свойств. Затем г-жа Бриггс попросила студентов написать пару предложений о том, как связаны эти концепции. Обратите внимание на то, как карточки для заметок служат для создания структуры среди научных концепций в примере на Рисунке 4 ниже.
Рис. 4. Научный пример сортировки и соединения концепций для построения схемы
Точно так же учитель математики Кортни Полл попросила своих учеников соединить пять концепций с помощью стикеров: линейные модели, таблица, рассказ, график и уравнение. Затем они написали параграф о том, как связаны концепции.
Студенты написали,
Поскольку история, уравнение, график и / или таблица являются частью линейной модели, пока у вас есть один компонент, вы можете найти остальные, используя имеющиеся числа.Таблица используется для поиска шаблонов на входе и выходе, а уравнение помогает найти конкретные значения для x и / или y. График дает нам визуальное представление модели, а история помогает нам установить связь с ситуациями реального мира ».
Вау. Представьте себе, если бы мы все так изучали математику. См. Рисунок на Рисунке 5 ниже.
Рисунок 5: Математический пример сортировки и соединения концепций для построения схемы
Учетные карточки и заметки на стикерах помогают студентам физически построить организационную структуру или схему непосредственно на своих партах.Важно отметить, что схема не строится за один проход при создании соединений. Схема построена на основе нескольких опытов установления соединений. Это упражнение можно и нужно повторять на протяжении всего модуля, семестра и учебного года. Учащиеся могут добавлять больше концепций и устанавливать больше связей каждый раз, когда они переносят свое понимание в новую ситуацию, в конечном итоге написав несколько абзацев о том, как концепции связаны и связаны.
Постоянные читатели этого блога, вероятно, знакомы с исследованием Джона Хэтти под названием Visible Learning . Его мета-анализ факторов, влияющих на обучение студентов, показывает, что величина эффекта 0,40 является средним значением для всех влияний. Таким образом, мы можем представить себе 0,40 примерно как годовой рост. Все, что выше .40, может повысить успеваемость учащихся (Visible Learning Plus, 2019).
Вот как оцениваются приведенные выше стратегии:
- Использование примеров концепций из предшествующих знаний учащихся = 0,93
- Разъяснение неправильных представлений о концепциях (концептуальные изменения) =.99
- Попросить учащихся разработать и систематизировать свое понимание концепций = 0,75
- Сопоставление концепций с другими концепциями = 0,64
- Стратегии передачи обучения = 0,86
Интересно, не правда ли? Преднамеренное обучение схемам поддерживается как когнитивной наукой, так и метаанализом достижений учащихся. Возьмите несколько каталожных карточек или заметок и помогите своим ученикам сохранить информацию и перенести ее в новые ситуации.
Подробнее о практических способах применения этого исследования в классе см. Или Инструменты для обучения концептуальному пониманию, Среднее или Инструменты для обучения концептуальному пониманию, Элементарный .
Начальное изображение любезно предоставлено Getty Images.
Ссылки:
Boaler, J. (2014). Экскурсия по математическим связям. YouCubed, Стэнфордская высшая школа образования. Источник: https://www.youcubed.org/resources/tour-mat Mathematical-connections/
Donovan, S., & Bransford, J. (2005). Как учатся студенты: история, математика и естественные науки в в классе. Вашингтон, округ Колумбия: Национальная академия прессы.
Эриксон, Х. Л., и Лэннинг, Л. А. (2014). Переход к учебной программе, основанной на концепциях, и инструкциям : как объединить содержание и процесс . Таузенд-Оукс, Калифорния: Corwin Press.
Фишер Д., Фрей Н. и Хэтти Дж. (2017). Визуальное обучение грамоте, классы K-12: внедрение методов, которые лучше всего работают для ускорения обучения учащихся .
Мета, Дж. И Файн, С. (2019). В поисках более глубокого обучения. Издательство Гарвардского университета: Кембридж, Массачусетс.
Пол, Р. и Элдер, Л. (2013). Как написать абзац: Искусство содержательного письма (3-е изд.). Томалес, Калифорния: Фонд критического мышления.
Стерн, Дж., Ферраро, К., и Монкерн, Дж. (2017). Инструменты для обучения концептуальному пониманию, среднее. Thousand Oaks, CA: Corwin, A SAGE Company.
Visible Learning Plus. (Июнь, 2019). 250+ факторов, влияющих на успеваемость учащихся.Corwin Press: Thousand Oaks, CA. Получено с: https://us.corwin.com/sites/default/files/250_influences_chart_june_2019.pdf
Учебное пособие по— настройка сопоставлений атрибутов Azure Active Directory в Application Provisioning
- Читать 15 минут
В этой статье
Microsoft Azure AD обеспечивает поддержку синхронизации пользователей для сторонних приложений SaaS, таких как Salesforce, G Suite и другие.Если вы включаете синхронизацию пользователей для стороннего приложения SaaS, портал Azure управляет значениями своих атрибутов с помощью сопоставлений атрибутов.
Прежде чем начать, убедитесь, что вы знакомы с принципами управления приложениями и единого входа (SSO) . Ознакомьтесь со следующими ссылками:
Существует предварительно настроенный набор атрибутов и сопоставлений атрибутов между пользовательскими объектами Azure AD и пользовательскими объектами каждого приложения SaaS. Некоторые приложения управляют другими типами объектов вместе с пользователями, например группами.
Вы можете настроить сопоставления атрибутов по умолчанию в соответствии с потребностями вашего бизнеса. Таким образом, вы можете изменить или удалить существующие сопоставления атрибутов или создать новые сопоставления атрибутов.
Редактирование сопоставлений атрибутов пользователей
Выполните следующие действия, чтобы получить доступ к функции синхронизации пользователей Mappings :
Войдите на портал Azure Active Directory.
Выберите Корпоративные приложения на левой панели.Отображается список всех настроенных приложений, включая приложения, добавленные из галереи.
Выберите любое приложение, чтобы загрузить его панель управления приложениями, где вы можете просматривать отчеты и управлять настройками приложения.
Выберите Provisioning , чтобы управлять настройками синхронизации учетной записи пользователя для выбранного приложения.
Разверните Сопоставления , чтобы просмотреть и изменить атрибуты пользователя, передаваемые между Azure AD и целевым приложением. Если целевое приложение поддерживает это, в этом разделе можно дополнительно настроить подготовку групп и учетных записей пользователей.
Выберите конфигурацию Mappings , чтобы открыть соответствующий экран Attribute Mappings . Некоторые сопоставления атрибутов требуются приложению SaaS для правильной работы. Для обязательных атрибутов функция Удалить недоступна.
На этом снимке экрана вы можете видеть, что атрибут Username управляемого объекта в Salesforce заполняется значением userPrincipalName связанного объекта Azure Active Directory.
Выберите существующее сопоставление атрибутов , чтобы открыть экран Редактировать атрибут . Здесь вы можете изменить атрибуты пользователя, которые передаются между Azure AD и целевым приложением.
Общие сведения о типах сопоставления атрибутов
С помощью сопоставления атрибутов вы управляете способом заполнения атрибутов в стороннем приложении SaaS. Поддерживаются четыре различных типа сопоставления:
- Direct — целевой атрибут заполняется значением атрибута связанного объекта в Azure AD.
- Константа — целевой атрибут заполняется указанной вами строкой.
- Выражение — целевой атрибут заполняется на основе результата выражения, подобного сценарию. Дополнительные сведения см. В разделе Написание выражений для сопоставления атрибутов в Azure Active Directory.
- Нет — целевой атрибут не изменен. Однако, если целевой атрибут когда-либо пуст, он заполняется указанным вами значением по умолчанию.
Наряду с этими четырьмя основными типами настраиваемые сопоставления атрибутов поддерживают концепцию необязательного присвоения значения по умолчанию . Назначение значения по умолчанию гарантирует, что целевой атрибут будет заполнен значением, если значение отсутствует в Azure AD или в целевом объекте. Наиболее распространенная конфигурация — оставить это поле пустым.
Общие сведения о свойствах сопоставления атрибутов
В предыдущем разделе вы уже познакомились со свойством типа сопоставления атрибутов.Наряду с этим свойством сопоставления атрибутов также поддерживают следующие атрибуты:
- Атрибут источника — атрибут пользователя из исходной системы (пример: Azure Active Directory).
- Целевой атрибут — Пользовательский атрибут в целевой системе (пример: ServiceNow).
- Значение по умолчанию, если ноль (необязательно) — Значение, которое будет передано в целевую систему, если исходный атрибут равен нулю. Это значение будет предоставлено только при создании пользователя.«Значение по умолчанию при нулевом значении» не будет предоставлено при обновлении существующего пользователя. Если, например, вы хотите предоставить всем существующим пользователям в целевой системе конкретное название должности (когда оно имеет значение null в исходной системе), вы можете использовать следующее выражение: Switch (IsPresent ([jobTitle]), «DefaultValue «,» Верно «, [jobTitle]). Обязательно замените «Значение по умолчанию» на то, что вы хотите предоставить при нулевом значении в исходной системе.
- Сопоставлять объекты с помощью этого атрибута — Следует ли использовать это сопоставление для однозначной идентификации пользователей между исходной и целевой системами.Обычно он устанавливается в атрибуте userPrincipalName или mail в Azure AD, который обычно сопоставляется с полем имени пользователя в целевом приложении.
- Приоритет сопоставления — Можно установить несколько атрибутов сопоставления. Если их несколько, они оцениваются в порядке, определенном этим полем. Как только совпадение найдено, никакие другие подходящие атрибуты не оцениваются. Хотя вы можете установить столько совпадающих атрибутов, сколько захотите, подумайте, действительно ли атрибуты, которые вы используете в качестве совпадающих атрибутов, уникальны и должны ли они совпадать.Обычно в конфигурации клиентов есть 1 или 2 совпадающих атрибута.
- Применить это сопоставление
- Всегда — применять это сопоставление как при создании, так и при обновлении пользователей.
- Только во время создания — применить это сопоставление только к действиям по созданию пользователей.
Сопоставление пользователей в исходной и целевой системах
Службу подготовки Azure AD можно развернуть как в сценариях «зеленого поля» (когда пользователи не существуют в целевой системе), так и в сценариях «коричневого поля» (когда пользователи уже существуют в целевой системе).Для поддержки обоих сценариев служба подготовки использует концепцию сопоставления атрибутов. Атрибуты сопоставления позволяют определить, как однозначно идентифицировать пользователя в источнике и сопоставлять пользователя в целевом объекте. В рамках планирования развертывания определите атрибут, который можно использовать для однозначной идентификации пользователя в исходной и целевой системах. На заметку:
- Соответствующие атрибуты должны быть уникальными: Клиенты часто используют такие атрибуты, как userPrincipalName, mail или идентификатор объекта в качестве совпадающего атрибута.
- В качестве совпадающих атрибутов можно использовать несколько атрибутов: Вы можете определить несколько атрибутов, которые будут оцениваться при сопоставлении пользователей и порядке их оценки (определяемом как соответствие приоритета в пользовательском интерфейсе). Если, например, вы определяете три атрибута как совпадающие атрибуты, и пользователь имеет однозначное соответствие после оценки первых двух атрибутов, служба не будет оценивать третий атрибут. Служба оценит совпадающие атрибуты в указанном порядке и прекратит оценку, когда совпадение будет найдено.
- Значение в источнике и цели не обязательно должно точно совпадать: Значение в цели может быть простой функцией значения в источнике. Таким образом, можно иметь атрибут emailAddress в источнике и userPrincipalName в целевом объекте и соответствовать функции атрибута emailAddress, который заменяет некоторые символы некоторым постоянным значением.
- Сопоставление на основе комбинации атрибутов не поддерживается: Большинство приложений не поддерживают запросы на основе двух свойств.Следовательно, сопоставление на основе комбинации атрибутов невозможно. Можно оценивать отдельные свойства за другим.
- У всех пользователей должно быть значение хотя бы для одного совпадающего атрибута: Если вы определяете один совпадающий атрибут, все пользователи должны иметь значение для этого атрибута в исходной системе. Если, например, вы определяете userPrincipalName как соответствующий атрибут, все пользователи должны иметь userPrincipalName. Если вы определяете несколько атрибутов соответствия (например,extensionAttribute1 и mail), не у всех пользователей должен быть одинаковый атрибут соответствия. Один пользователь может иметь extensionAttribute1, но не почту, в то время как другой пользователь может иметь почту, но не extensionAttribute1.
- Целевое приложение должно поддерживать фильтрацию по соответствующему атрибуту: Разработчики приложений разрешают фильтрацию для подмножества атрибутов в своем пользовательском или групповом API. Для приложений в галерее мы гарантируем, что сопоставление атрибутов по умолчанию предназначено для атрибута, для которого API целевого приложения поддерживает фильтрацию.При изменении атрибута сопоставления по умолчанию для целевого приложения проверьте документацию стороннего API, чтобы убедиться, что атрибут можно фильтровать.
Редактирование групповых сопоставлений атрибутов
Выбранное количество приложений, таких как ServiceNow, Box и G Suite, поддерживает возможность предоставления объектов групп и пользователей. Объекты группы могут содержать свойства группы, такие как отображаемые имена и псевдонимы электронной почты, вместе с членами группы.
Групповую подготовку можно дополнительно включить или отключить, выбрав сопоставление группы в разделе Сопоставления и установив для параметра Включено значение, которое вы хотите на экране сопоставления атрибутов .
Атрибуты, предоставленные как часть объектов группы, можно настроить таким же образом, как и объекты пользователя, описанные ранее.
Подсказка
Предоставление групповых объектов (свойств и членов) — это концепция, отличная от назначения групп приложению. Можно назначить группу приложению, но только подготовить пользовательские объекты, содержащиеся в группе. Для использования групп в назначениях не требуется предоставление полных групповых объектов.
Редактирование списка поддерживаемых атрибутов
Пользовательские атрибуты, поддерживаемые для данного приложения, предварительно настроены.Большинство API-интерфейсов управления пользователями приложений не поддерживают обнаружение схемы. Таким образом, служба подготовки Azure AD не может динамически создавать список поддерживаемых атрибутов, выполняя вызовы приложения.
Однако некоторые приложения поддерживают настраиваемые атрибуты, и служба подготовки Azure AD может читать и записывать настраиваемые атрибуты. Чтобы ввести их определения на портал Azure, установите флажок Показать дополнительные параметры в нижней части экрана Сопоставление атрибутов , а затем выберите Изменить список атрибутов для вашего приложения.
Приложения и системы, поддерживающие настройку списка атрибутов, включают:
- Salesforce
- ServiceNow
- Workday в Active Directory / Workday в Azure Active Directory
- SuccessFactors в Active Directory / SuccessFactors в Azure Active Directory
- Azure Active Directory (поддерживаются стандартные атрибуты API Azure AD Graph и настраиваемые расширения каталогов). Узнайте больше о создании расширений и известных ограничениях.
- Приложения, поддерживающие SCIM 2.0
- Для обратной записи Azure Active Directory в Workday или SuccessFactors поддерживается обновление соответствующих метаданных для поддерживаемых атрибутов (XPATH и JSONPath), но не поддерживается добавление новых атрибутов Workday или SuccessFactors, помимо тех, которые включены в схему по умолчанию
Примечание
Редактировать список поддерживаемых атрибутов рекомендуется только администраторам, которые настроили схему своих приложений и систем и из первых рук знают, как были определены их настраиваемые атрибуты, или если исходный атрибут не отображается автоматически на портале Azure. UI.Иногда для этого требуется знакомство с API и инструментами разработчика, предоставляемыми приложением или системой. Возможность редактировать список поддерживаемых атрибутов заблокирована по умолчанию, но клиенты могут включить эту возможность, перейдя по следующему URL-адресу: https://portal.azure.com/?Microsoft_AAD_Connect_Provisioning_forceSchemaEditorEnabled=true. Затем вы можете перейти к своему приложению, чтобы просмотреть список атрибутов, как описано выше.
При редактировании списка поддерживаемых атрибутов предоставляются следующие свойства:
- Имя — системное имя атрибута, как определено в схеме целевого объекта.
- Тип — Тип данных, которые хранит атрибут, как определено в схеме целевого объекта, который может быть одним из следующих типов:
- Двоичный — Атрибут содержит двоичные данные.
- Boolean — Атрибут содержит значение True или False.
- DateTime — Атрибут содержит строку даты.
- Целое число — Атрибут содержит целое число.
- Ссылка — Атрибут содержит идентификатор, который ссылается на значение, хранящееся в другой таблице в целевом приложении.
- Строка — Атрибут содержит текстовую строку.
- Первичный ключ? — Определен ли атрибут как поле первичного ключа в схеме целевого объекта.
- Обязательно? — Требуется ли заполнение атрибута в целевом приложении или системе.
- Многозначный? — поддерживает ли атрибут несколько значений.
- Точный случай? — Учитываются ли значения атрибутов с учетом регистра.
- Выражение API — Не используйте, если это не указано в документации для конкретного соединителя подготовки (например, Workday).
- Атрибут ссылочного объекта — Если это атрибут ссылочного типа, то это меню позволяет выбрать таблицу и атрибут в целевом приложении, которые содержат значение, связанное с атрибутом. Например, если у вас есть атрибут с именем «Отдел», сохраненное значение которого ссылается на объект в отдельной таблице «Отделы», вы должны выбрать «Отделы».Имя ». Справочные таблицы и поля первичного идентификатора, поддерживаемые для данного приложения, предварительно настроены и в настоящее время не могут редактироваться с помощью портала Azure, но могут редактироваться с помощью Microsoft Graph API.
Предоставление настраиваемого атрибута расширения приложению, совместимому с SCIM
SCIM RFC определяет схему основных пользователей и групп, а также допускает расширения схемы для удовлетворения потребностей вашего приложения. Чтобы добавить настраиваемый атрибут в приложение SCIM:
- Войдите на портал Azure Active Directory, выберите Корпоративные приложения , выберите свое приложение, а затем выберите Provisioning .
- В разделе Сопоставления выберите объект (пользователя или группу), для которого вы хотите добавить настраиваемый атрибут.
- Внизу страницы выберите Показать дополнительные параметры .
- Выберите Изменить список атрибутов для AppName .
- Внизу списка атрибутов введите информацию о настраиваемом атрибуте в соответствующие поля. Затем выберите Добавить атрибут .
Для приложений SCIM имя атрибута должно соответствовать шаблону, показанному в примере ниже.«CustomExtensionName» и «CustomAttribute» можно настроить в соответствии с требованиями вашего приложения, например: urn: ietf: params: scim: schemas: extension: CustomExtensionName: 2.0: User: CustomAttribute
Эти инструкции применимы только к приложениям с поддержкой SCIM. Такие приложения, как ServiceNow и Salesforce, не интегрированы с Azure AD с помощью SCIM, и поэтому им не требуется это конкретное пространство имен при добавлении настраиваемого атрибута.
Настраиваемые атрибуты не могут быть ссылочными, многозначными или сложными типами. Настраиваемые многозначные атрибуты и атрибуты расширений со сложным типом в настоящее время поддерживаются только для приложений в галерее. Заголовок схемы настраиваемого расширения опущен в приведенном ниже примере, поскольку он не отправляется в запросах от клиента SCIM Azure AD. Эта проблема будет исправлена в будущем, и заголовок будет отправлен в запросе.
Пример представления пользователя с атрибутом расширения:
{
"схемы": ["urn: ietf: params: scim: schemas: core: 2.0: Пользователь ",
"urn: ietf: params: scim: schemas: extension: enterprise: 2.0: User"],
"userName": "bjensen",
"id": "48af03ac28ad4fb88478",
"externalId": "bjensen",
"имя":{
"formatted": "Ms. Barbara J Jensen III",
"familyName": "Дженсен",
"givenName": "Барбара"
},
"urn: ietf: params: scim: schemas: extension: enterprise: 2.0: User": {
"employeeNumber": "701984",
"costCenter": "4130",
"организация": "Юниверсал Студиос",
«дивизия»: «Тематический парк»,
«отдел»: «Экскурсионные операции»,
"менеджер": {
"значение": "26118915-6090-4610-87e4-49d8ca9f808d",
"$ ref": ". ./Users/26118915-6090-4610-87e4-49d8ca9f808d ",
"displayName": "Джон Смит"
}
},
"urn: ietf: params: scim: schemas: extension: CustomExtensionName: 2.0: User": {
"CustomAttribute": "701984",
},
"meta": {
"resourceType": "Пользователь",
"created": "2010-01-23T04: 56: 22Z",
"lastModified": "2011-05-13T04: 42: 34Z",
"версия": "W \ / \" 3694e05e9dff591 \ "",
"место нахождения":
"https://example.com/v2/Users/2819c223-7f76-453a-919d-4138616"
}
}
Предоставление роли приложению SCIM
Выполните следующие действия, чтобы подготовить роли для пользователя в вашем приложении.Обратите внимание, что приведенное ниже описание относится к пользовательским приложениям SCIM. Для приложений галереи, таких как Salesforce и ServiceNow, используйте предварительно определенные сопоставления ролей. В следующих маркерах описывается, как преобразовать атрибут AppRoleAssignments в формат, ожидаемый вашим приложением.
Сопоставление appRoleAssignment в Azure AD с ролью в вашем приложении требует преобразования атрибута с помощью выражения. Атрибут appRoleAssignment не должен напрямую отображаться на атрибут роли без использования выражения для анализа деталей роли.
Назначение одного приложения
- Когда использовать: Используйте выражение SingleAppRoleAssignment, чтобы предоставить пользователю единую роль и указать основную роль.
- Как настроить: Используйте шаги, описанные выше, чтобы перейти на страницу сопоставлений атрибутов и использовать выражение SingleAppRoleAssignment для сопоставления с атрибутом ролей. Можно выбрать один из трех атрибутов ролей: (роли [первичный эквивалент «Истина»].отображение, роли [первичный эквалайзер «Истина]. тип и роли [первичный эквалайзер« Истинно »]. значение). Вы можете выбрать включение любого или всех атрибутов роли в свои сопоставления. Если вы хотите включить более одного , просто добавьте новое сопоставление и включите его в качестве целевого атрибута.
На что следует обратить внимание
- Убедитесь, что пользователю не назначено несколько ролей. Мы не можем гарантировать, какая роль будет предоставлена.
Пример запроса (POST)
{ "схемы": [ "urn: ietf: params: scim: schemas: core: 2.0: Пользователь " ], "externalId": "псевдоним", "userName": "[email protected]", "активный": правда, "displayName": "Имя Фамилия", "meta": { "resourceType": "Пользователь" }, "роли": [ { "первичный": правда, "type": "WindowsAzureActiveDirectoryRole", "value": "Admin" } ] }
«Операции»: [ { "op": "Добавить", "путь": "роли", "ценить": [ { "значение": "{\" id \ ": \" 06b07648-ecfe-589f-9d2f-6325724a46ee \ ", \" значение \ ": \" 25 \ ", \" displayName \ ": \" Role1234 \ "} " } ]
Формат запроса в PATCH и POST различается. Чтобы гарантировать, что POST и PATCH отправляются в одном и том же формате, вы можете использовать описанный здесь флаг функции.
Комплекс заявок
Когда использовать: Используйте выражение AppRoleAssignmentsComplex, чтобы предоставить пользователю несколько ролей.
Как настроить: Измените список поддерживаемых атрибутов, как описано выше, чтобы включить новый атрибут для ролей:
Затем используйте выражение AppRoleAssignmentsComplex для сопоставления с атрибутом настраиваемой роли, как показано на изображении ниже:
На что обратить внимание
- Для всех ролей будет указано значение primary = false.
- POST содержит тип роли. Запрос PATCH не содержит типа. Мы работаем над отправкой типа как в запросах POST, так и в PATCH.
Пример вывода
{ "схемы": [ "urn: ietf: params: scim: schemas: core: 2. 0: User" ], "externalId": "псевдоним", "userName": "[email protected]", "активный": правда, "displayName": "Имя Фамилия", "meta": { "resourceType": "Пользователь" }, "роли": [ { "первичный": ложь, "type": "WindowsAzureActiveDirectoryRole", "display": "Admin", "value": "Admin" }, { "первичный": ложь, "type": "WindowsAzureActiveDirectoryRole", "display": "Пользователь", "значение": "Пользователь" } ] }
Создание многозначного атрибута
Некоторые атрибуты, такие как phoneNumbers и emails, являются многозначными, и вам может потребоваться указать разные типы номеров телефонов или адресов электронной почты.Используйте приведенное ниже выражение для многозначных атрибутов. Он позволяет указать тип атрибута и сопоставить его с соответствующим атрибутом пользователя Azure AD для значения.
phoneNumbers [введите eq «work»]. Значение
phoneNumbers [введите eq «mobile»]. Значение
phoneNumbers [введите eq «fax»]. Значение
"phoneNumbers": [ { "значение": "555-555-5555", "тип": "работа" }, { "значение": "555-555-5555", "тип": "мобильный" }, { "значение": "555-555-5555", "тип": "факс" } ]
Восстановление атрибутов по умолчанию и сопоставлений атрибутов
Если вам нужно начать заново и сбросить существующие сопоставления до состояния по умолчанию, вы можете установить флажок Восстановить сопоставления по умолчанию и сохранить конфигурацию.При этом все сопоставления и фильтры области устанавливаются так, как если бы приложение было только что добавлено в ваш клиент Azure AD из галереи приложений.
Выбор этого параметра приведет к принудительной повторной синхронизации всех пользователей во время работы службы подготовки.
Важно
Мы настоятельно рекомендуем установить для параметра Provisioning status значение Off перед вызовом этой опции.
Что следует знать
- Microsoft Azure AD обеспечивает эффективную реализацию процесса синхронизации.В инициализированной среде во время цикла синхронизации обрабатываются только объекты, требующие обновления.
- Обновление сопоставлений атрибутов влияет на производительность цикла синхронизации. Обновление конфигурации сопоставления атрибутов требует переоценки всех управляемых объектов.
- Рекомендуемая передовая практика — свести к минимуму количество последовательных изменений в ваших сопоставлениях атрибутов.
- Добавление атрибута фотографии для подготовки к приложению сегодня не поддерживается, поскольку вы не можете указать формат для синхронизации фотографии.Вы можете запросить эту функцию на User Voice
- Атрибут IsSoftDeleted часто является частью сопоставлений по умолчанию для приложения. IsSoftdeleted может иметь значение true в одном из четырех сценариев (пользователь выходит за пределы области действия из-за того, что он не назначен из приложения, пользователь находится вне области действия из-за несоответствия фильтру области действия, пользователь был мягко удален в Azure AD или для свойства AccountEnabled установлено значение false для пользователя). Не рекомендуется удалять атрибут IsSoftDeleted из сопоставлений атрибутов.
- Служба подготовки Azure AD не поддерживает подготовку нулевых значений.
- Это первичный ключ, обычно «ID», не следует включать в качестве целевого атрибута в ваши сопоставления атрибутов.
- Атрибут роли обычно необходимо отображать с помощью выражения, а не прямого отображения. См. Раздел выше для получения дополнительных сведений о сопоставлении ролей.
- Хотя вы можете отключить группы из своих сопоставлений, отключение пользователей не поддерживается.
Следующие шаги
8.4.7 Ограничения на количество столбцов в таблице и размер строки
Максимальный размер строки MySQL 65 535 байт составляет
продемонстрировано в следующем InnoDB
и MyISAM
примеров. Предел
принудительно независимо от механизма хранения, даже если
механизм хранения может поддерживать строки большего размера.
mysql> СОЗДАТЬ ТАБЛИЦУ t (VARCHAR (10000), b VARCHAR (10000),
c VARCHAR (10000), d VARCHAR (10000), e VARCHAR (10000),
f VARCHAR (10000), g VARCHAR (6000)) ENGINE = InnoDB CHARACTER SET latin1;
ОШИБКА 1118 (42000): слишком большой размер строки.Максимальный размер строки для используемого
тип таблицы, не считая больших двоичных объектов, равен 65535. Это включает накладные расходы на хранилище,
проверьте руководство. Вы должны изменить некоторые столбцы на ТЕКСТ или BLOB
mysql> CREATE TABLE t (a VARCHAR (10000), b VARCHAR (10000),
c VARCHAR (10000), d VARCHAR (10000), e VARCHAR (10000),
f VARCHAR (10000), g VARCHAR (6000)) ENGINE = НАБОР СИМВОЛОВ MyISAM latin1;
ОШИБКА 1118 (42000): слишком большой размер строки. Максимальный размер строки для используемого
Тип таблицы, не считая больших двоичных объектов, равен 65535. Это включает накладные расходы на хранилище,
проверьте руководство. Вам необходимо изменить некоторые столбцы на ТЕКСТ или BLOB
В следующем примере MyISAM
,
изменение столбца на ТЕКСТ
позволяет избежать ограничения на размер строки в 65 535 байт и позволяет
операция для успеха, потому что BLOB
и TEXT
только столбцы
вносить от 9 до 12 байтов в размер строки.
mysql> СОЗДАТЬ ТАБЛИЦУ t (VARCHAR (10000), b VARCHAR (10000),
c VARCHAR (10000), d VARCHAR (10000), e VARCHAR (10000),
f VARCHAR (10000), g TEXT (6000)) ENGINE = MyISAM CHARACTER SET latin1;
Запрос выполнен, затронуты 0 строк (0.02 сек)
Операция завершается успешно для InnoDB
таблица, потому что изменение столбца на ТЕКСТ
избегает MySQL
Ограничение размера строки 65 535 байт и InnoDB
внестраничное хранение столбцов переменной длины позволяет избежать InnoDB
ограничение размера строки.
mysql> СОЗДАТЬ ТАБЛИЦУ t (VARCHAR (10000), b VARCHAR (10000),
c VARCHAR (10000), d VARCHAR (10000), e VARCHAR (10000),
f VARCHAR (10000), g TEXT (6000)) ENGINE = InnoDB CHARACTER SET latin1;
Запрос выполнен, затронуты 0 строк (0.02 сек)
Хранение столбцов переменной длины включает байты длины,
которые засчитываются в размер строки. Например, VARCHAR (255)
CHARACTER SET utf8mb3
столбец занимает два байта для
сохранить длину значения, поэтому каждое значение может занимать
до 767 байт.
Заявление для создания таблицы t1
успешно, потому что столбцы требуют 32 765 + 2 байта и
32 766 + 2 байта, что соответствует максимальному размеру строки
из 65 535 байт:
mysql> СОЗДАТЬ ТАБЛИЦУ t1
(c1 VARCHAR (32765) NOT NULL, c2 VARCHAR (32766) NOT NULL)
ДВИГАТЕЛЬ = НАБОР СИМВОЛОВ InnoDB latin1;
Запрос выполнен, затронуты 0 строк (0. 02 сек)
Оператор для создания таблицы t2
не работает
потому что, хотя длина столбца находится в пределах максимального
длина 65 535 байт, требуются два дополнительных байта
для записи длины, которая приводит к превышению размера строки
65 535 байт:
mysql> СОЗДАТЬ ТАБЛИЦУ t2
(c1 VARCHAR (65535) NOT NULL)
ДВИГАТЕЛЬ = НАБОР СИМВОЛОВ InnoDB latin1;
ОШИБКА 1118 (42000): слишком большой размер строки.Максимальный размер строки для используемого
тип таблицы, не считая больших двоичных объектов, равен 65535. Это включает накладные расходы на хранилище,
проверьте руководство. Вам необходимо изменить некоторые столбцы на ТЕКСТ или BLOB
Уменьшение длины столбца до 65 533 или менее позволяет заявление об успехе.
mysql> СОЗДАТЬ ТАБЛИЦУ t2
(c1 VARCHAR (65533) NOT NULL)
ДВИГАТЕЛЬ = НАБОР СИМВОЛОВ InnoDB latin1;
Запрос в порядке, затронуты 0 строк (0,01 сек)
Для таблиц MyISAM
, NULL
столбцам требуется дополнительное пространство
в строке, чтобы записать, соответствуют ли их значения НЕТ
. Каждый NULL
столбец занимает на один бит больше, округляется до ближайшего
байт.
Оператор для создания таблицы t3
не работает
потому что MyISAM
требует места
для NULL
столбцов в дополнение к
пространство, необходимое для байтов длины столбца переменной длины,
в результате чего размер строки превышает 65 535 байт:
mysql> СОЗДАТЬ ТАБЛИЦУ t3
(c1 VARCHAR (32765) NULL, c2 VARCHAR (32766) NULL)
ДВИГАТЕЛЬ = НАБОР СИМВОЛОВ MyISAM latin1;
ОШИБКА 1118 (42000): слишком большой размер строки.Максимальный размер строки для используемого
тип таблицы, не считая больших двоичных объектов, равен 65535. Это включает накладные расходы на хранилище,
проверьте руководство. Вам необходимо изменить некоторые столбцы на ТЕКСТ или BLOB
Для получения информации о InnoDB
NULL
хранилище столбцов, см. Раздел 15.10, «Форматы строк InnoDB».
InnoDB
ограничивает размер строки (для данных
хранится локально на странице базы данных), чтобы немного меньше
более половины страницы базы данных для 4 КБ, 8 КБ, 16 КБ и 32 КБ innodb_page_size
настройки и чуть меньше 16 КБ для страниц размером 64 КБ.
Оператор для создания таблицы t4
не работает
потому что определенные столбцы превышают предел размера строки для
страница 16KB InnoDB
.
mysql> СОЗДАТЬ ТАБЛИЦУ t4 (
c1 СИМВОЛ (255), c2 СИМВОЛ (255), c3 СИМВОЛ (255),
c4 СИМВОЛ (255), c5 СИМВОЛ (255), c6 СИМВОЛ (255),
c7 СИМВОЛ (255), c8 СИМВОЛ (255), c9 СИМВОЛ (255),
c10 СИМВОЛ (255), c11 СИМВОЛ (255), c12 СИМВОЛ (255),
c13 СИМВОЛ (255), c14 СИМВОЛ (255), c15 СИМВОЛ (255),
c16 СИМВОЛ (255), c17 СИМВОЛ (255), c18 СИМВОЛ (255),
c19 СИМВОЛ (255), c20 СИМВОЛ (255), c21 СИМВОЛ (255),
c22 СИМВОЛ (255), c23 СИМВОЛ (255), c24 СИМВОЛ (255),
c25 СИМВОЛ (255), c26 СИМВОЛ (255), c27 СИМВОЛ (255),
c28 СИМВОЛ (255), c29 СИМВОЛ (255), c30 СИМВОЛ (255),
c31 СИМВОЛ (255), c32 СИМВОЛ (255), c33 СИМВОЛ (255)
) ДВИГАТЕЛЬ = InnoDB ROW_FORMAT = ДИНАМИЧЕСКАЯ СИСТЕМА ДИНАМИКИ ПО УМОЛЧАНИЮ latin1;
ОШИБКА 1118 (42000): слишком большой размер строки (> 8126). Может помочь изменение некоторых столбцов на TEXT или BLOB.
В текущем формате строки префикс BLOB, равный 0 байтам, хранится в строке.
BigQuery для специалистов по хранилищам данных | Центр облачной архитектуры
Обновлено июнь 2021 г.
В этом документе объясняется, как использовать BigQuery. как хранилище данных. Он сопоставляет общие концепции хранилищ данных с концепциями в BigQuery и описывает, как выполнять стандартное хранилище данных. задачи в BigQuery. Этот документ предназначен для людей, которые управлять хранилищами данных и системами больших данных.
Сравнение сервисных моделей
В следующей таблице стандартные концепции хранилищ данных сопоставляются с концепциями в BigQuery:
Хранилище данных | BigQuery |
---|---|
Хранилище данных | Служба BigQuery заменяет типичную настройку оборудования для традиционное хранилище данных. То есть он служит коллективным домом для все аналитические данные в организации. |
Витрина данных | Наборы данных — это наборы таблиц, которые можно разделить по бизнес-направлениям. или заданная аналитическая область.Каждый набор данных привязан к проекту Google Cloud. |
Озеро данных | Ваше озеро данных может содержать файлы в облачном хранилище или на Google Диске или данные транзакций в Bigtable или Cloud SQL. BigQuery может определять схему и отправлять запросы непосредственно на внешние данные как источники объединенных данных. В API хранилища BigQuery предлагает параллельное чтение с высокой пропускной способностью и совместим с общими средами обработки, такими как Spark и Pandas. |
Ресурсы BigQuery
BigQuery имеет иерархическую структуру.Его уровни указаны в следующая диаграмма:
Проектов
Все ресурсы Google Cloud, которые вы выделяете и используете, должны принадлежать проекту. Проект — это организующая сущность того, что вы создаете с помощью Google Cloud. в контекст BigQuery, проект — это контейнер для всех Ресурсы BigQuery. Поскольку BigQuery разделяет хранилище и вычисления, проекты, которые хранят и запрашивают данные, могут быть другой.
Наборы данных
Наборы данных — это контейнеры верхнего уровня, которые вы используете для организации своих Таблицы и представления BigQuery.Они часто сопоставляются со схемами в стандартные реляционные базы данных и хранилища данных.
набора данных привязаны к вашему облачному проекту. Когда вы ссылаетесь на таблицу из командной строки, в запросах SQL или в коде вы обращаетесь к нему следующим образом:
project.dataset.table
Набор данных привязан к место нахождения. Расположение наборов данных следующее:
- Региональный : определенное географическое место, например Лондон.
- Многорегиональный : большая географическая область, например США, которая содержит два или более географических места.
Местоположение набора данных можно указать только во время его создания. А запрос может содержать таблицы или представления из разных наборов данных в одном и том же место нахождения.
Использование этих нескольких областей (проект, набор данных, таблица и местоположение) может помочь вы структурируете свою информацию логически и географически.
Столы
таблицы BigQuery представляют собой структуры строка-столбец, в которых хранятся ваши данные. Каждая таблица определяется схема, которая описывает имена столбцов, типы данных и другую информацию.Ты может указать схему таблицы при ее создании. В качестве альтернативы вы можете создать таблицу без схемы и указать схему в задании запроса или загрузке задание, которое сначала заполняет его данными. BigQuery имеет следующие видов столов:
- Собственные таблицы : Таблицы, поддерживаемые собственным хранилищем BigQuery.
- Внешние таблицы : Таблицы, поддерживаемые внешним хранилищем BigQuery.
- Просмотры : виртуальные таблицы, определяемые запросом SQL.
Для получения дополнительной информации см. Управление хранилищем.
Вакансий
вакансий действия, которые BigQuery выполняет от вашего имени для загрузки данных, экспортировать данные, запросить данные или скопировать данные. Вакансии не связаны с одним проектом где хранятся ваши данные. Однако место, где может выполняться задание, — связано с расположением набора данных. Например, если вы загружаете данные из Сегмент Cloud Storage в набор данных BigQuery, который расположенный в Сингапуре, региональное или мультирегиональное облачное хранилище ведро также должно быть расположено в Сингапуре.В качестве альтернативы, если ваш набор данных расположен в европейском регионе, вы не можете запрашивать его из других регионов, например НАС. Это гарантирует выполнение требований к размещению данных.
Подготовка и определение конфигурации системы
Вам не нужно выделять ресурсы перед использованием BigQuery, в отличие от многих систем РСУБД. BigQuery выделяет хранилище и запрашивает ресурсы динамически в зависимости от ваших шаблонов использования:
- Ресурсы хранилища выделяются по мере их использования и освобождаются по мере их использования. вы удаляете данные или отбрасываете таблицы.
- Ресурсы запроса распределяются в соответствии с типом и сложностью запроса. Каждый запрос использует некоторое количество слотов, которые являются единицами вычислений, которые содержат определенное количество ЦП и ОЗУ.
Вам не нужно брать на себя обязательства по минимальному использованию, чтобы использовать BigQuery. Сервис распределяет ресурсы и взимает плату за них на основе от вашего фактического использования. По умолчанию у всех клиентов BigQuery есть доступ к 2000 слотам для операций запроса. Вы также можете сделать резервирование слотов для вашего проекта.Подробнее о том, какой подход использовать, см. Расходы.
Примечание. Чтобы начать использовать BigQuery, вы создаете проект для размещения ваши данные, а затем вы включаете биллинг. Инструкции см. В Быстрый запуск BigQuery.Управление хранением
Внутри BigQuery хранит данные в собственном столбце. формат называется Конденсатор, который имеет ряд преимуществ для рабочих нагрузок хранилищ данных. BigQuery использует собственный формат, потому что он может развиваться в тандем с механизмом запросов, который использует преимущества глубокого знания макет данных для оптимизации выполнения запроса.BigQuery использует запрос шаблоны доступа для определения оптимального количества физических шардов и способов их использования. закодированы.
Данные физически хранятся в распределенной файловой системе Google, называемой Колосс, что обеспечивает долговечность за счет использования кодирование стирания для хранения избыточных фрагментов данных на нескольких физических дисках. Более того, данные реплицируются в несколько центров обработки данных.
Вы также можете запускать запросы BigQuery к данным за пределами Хранилище BigQuery, например данные, хранящиеся в облачном хранилище, Google Диск или Bigtable, используя объединенные источники данных.Однако эти источники не оптимизированы для операций BigQuery, поэтому они могут работать не так хорошо, как данные, хранящиеся в BigQuery. место хранения.
Техническое обслуживание
BigQuery — это полностью управляемая служба, а это означает, что Команда инженеров BigQuery заботится об обновлениях и обслуживании для тебя. Обновления обычно не требуют простоев или снижают производительность системы.
Многие традиционные системы требуют ресурсоемких процессов вакуумирования для работы на различные интервалы для перетасовки и сортировки блоков данных и освобождения места.BigQuery не имеет эквивалента вакуумного управления или управления индексами, потому что механизм хранения постоянно управляет и оптимизирует способ хранения данных и тиражируется. Кроме того, поскольку BigQuery не использует индексы для таблицы, вам не нужно перестраивать индексы.
Резервное копирование и восстановление
Управление резервным копированием и доступностью всегда было сложной и дорогостоящей задачей.
для администраторов баз данных. Потребность в дополнительных лицензиях и оборудовании может
значительно увеличивают затраты. BigQuery решает проблемы резервного копирования и аварийных ситуаций
восстановление на сервисном уровне.Сохраняя полную семидневную историю
изменений в ваших таблицах, BigQuery позволяет запрашивать
моментальный снимок ваших данных с помощью либо декораторов таблиц, либо SYSTEM_TIME AS OF
в ИЗ
п.
Вы можете легко отменить изменения, не запрашивая восстановления из резервных копий.
Когда таблица удаляется явным образом, ее история очищается через семь дней.
Кроме того, команда cp
предлагает мгновенные моментальные снимки таблицы в регионе.
набора данных BigQuery
может быть региональным или многорегиональным.Для региональных наборов данных, например набора данных
расположен в регионе us-central1
, копии набора данных не хранятся за пределами
региона. Если вы считаете отсутствие резервных копий за пределами одного региона рискованным для
вашего бизнеса, вы можете создавать и планировать межрегиональные копии, используя
Служба передачи данных BigQuery.
Для мультирегиональных наборов данных, расположенных в больших географических регионах, таких как Европа
(ЕС) копия автоматически сохраняется в другом регионе Google Cloud.
В случае сбоя в регионе некоторые недавние данные могут быть потеряны.Для получения дополнительной информации см. Документация BigQuery о доступности и надежности.
Управление рабочими процессами
В этом разделе обсуждаются административные задачи, такие как организация наборов данных, предоставление разрешений и адаптация в BigQuery. В в разделе также обсуждается, как управлять параллельными рабочими нагрузками, отслеживать состояние хранилище данных и аудит доступа пользователей.
Организация наборов данных
Вы можете сегментировать наборы данных в отдельные проекты на основе класса данных или бизнес-единицы или объединить их в общие проекты для простоты.
Вы можете пригласить аналитика данных для совместной работы над существующим набором данных в любом ограниченная роль, которую вы определяете. Когда аналитик данных входит в Веб-консоль BigQuery, они видят только те ресурсы BigQuery, которые имеют был предоставлен им в разных проектах. Действия, которые они могут выполнять по отношению к наборам данных варьируется в зависимости от их роли по отношению к каждому набору данных.
Предоставление разрешений
В традиционной системе СУБД вы предоставляете разрешения на просмотр или изменение таблиц. путем создания грантов SQL и применения их к данному пользователю в базе данных система. Кроме того, некоторые системы СУБД позволяют предоставлять разрешения пользователям в внешний каталог, например LDAP. Модель BigQuery для управления пользователи и разрешения напоминают последнюю модель.
Cloud Identity это встроенный центральный поставщик удостоверений в Google Cloud, который позволяет аутентификация пользователя. Это часть Управление идентификацией и доступом (IAM). Помимо аутентификации, IAM предоставляет вам централизованный контроль для авторизации личности с определенными разрешениями для BigQuery и его наборы данных.Вы можете использовать предопределенные роли или создать собственные роли для контроля доступа. Для доступа пользователей, не являющихся людьми, к BigQuery ресурсов, вы можете создать учетную запись службы и назначьте ему требуемую роль. Пример использования этого подхода дает доступ к сценариям загрузки данных по расписанию.
Важным аспектом работы хранилища данных является разрешение совместного использования, но контролируемый доступ к одним и тем же данным для разных групп пользователей. Для Например, финансовый, кадровый и маркетинговый отделы имеют доступ к одним и тем же таблицам, но их уровни доступа различаются.Традиционные инструменты хранилищ данных делают это возможно за счет обеспечения безопасности на уровне строк. Вы можете добиться тех же результатов в BigQuery, определив авторизованные просмотры а также разрешения на уровне строк. Для таблиц, которые содержат конфиденциальные данные в определенных столбцах, вы можете использовать теги политики данных вместе с ролями IAM для обеспечения безопасность на уровне столбцов. Для получения дополнительной информации об управлении данными см. Перенос хранилищ данных на BigQuery: управление данными.
Прием на работу
С обычными хранилищами данных, привлечение новых аналитиков данных значительное время выполнения заказа.Чтобы аналитики могли выполнять простые запросы, вам нужно было показать там, где находятся источники данных, и настраивают ODBC-соединения, инструменты и доступ прав. Используя Google Cloud, вы можете значительно ускорить время аналитика на продуктивность.
Чтобы привлечь аналитика в Google Cloud, вы предоставить доступ к соответствующим проектам, познакомить их с Google Cloud Console и BigQuery веб-консоль и поделитесь некоторыми запросами, чтобы помочь им ознакомиться с данными:
- Облачная консоль обеспечивает централизованный просмотр всех активов в вашем Google Cloud среда.Наиболее подходящим активом для аналитиков данных может быть Сегменты облачного хранилища, где они могут совместно работать над файлами.
- Веб-консоль BigQuery представляет список наборов данных доступ к которым есть у аналитика. Аналитики могут выполнять задачи в Облачная консоль в соответствии с ролью, которую вы им предоставляете, например просмотр метаданных, предварительный просмотр данных, выполнение, сохранение и совместное использование запросов.
Обнаружение данных является серьезной проблемой для предприятий при внедрении как новых и опытные пользователи. Очень важно уметь найти Необходимые данные. Не менее важно защитить конфиденциальные данные и разрешить доступ к данным. Вы можете использовать каталог данных для автоматического предоставления таких возможностей, как поиск метаданных и потеря данных профилактика. Для получения дополнительной информации об обнаружении данных см. Обнаружение данных.
Управление рабочими нагрузками и параллелизмом
В этом разделе обсуждаются доступные вам элементы управления для управления рабочими нагрузками, количество одновременных запросов, которые вы можете сделать, и планирование заданий.
Квоты на услуги
Квоты обслуживания используются для поддержания постоянного качества обслуживания при использовании BigQuery и задокументированы в Политика квот BigQuery. Каждое ограничение квоты имеет значение по умолчанию для всех потребителей. Например, вы можете установить максимальное количество одновременных запросов до 100 по умолчанию. Если вам нужно увеличивайте или уменьшайте это число, вы можете сделать это с переопределением квоты.
Пользовательские квоты
Если у вас несколько проектов и пользователей BigQuery, вы можете управлять расходы, запросив настраиваемая квота который определяет ограничение на количество данных запроса, обрабатываемых в день.Ежедневные квоты сбросить в полночь по тихоокеанскому времени.
Приоритезация и планирование запросов
BigQuery предлагает два типа приоритеты запросов: interactive и batch . По умолчанию BigQuery работает в интерактивном режиме. запросов, что означает, что запрос выполняется как можно скорее. Интерактивный запросы учитываются в квоты ограничения одновременной скорости. Пакетные запросы ставятся в очередь и выполняются, когда доступны простаивающие ресурсы, обычно в течение нескольких минут. Если BigQuery не запустил запрос в 24 часа BigQuery меняет приоритет задания на интерактивный. Партия запросы не учитываются в квоте ограничения одновременной скорости.
BigQuery реализует алгоритм справедливого планирования в случаях, когда параллельные запросы могут использовать больше слотов, чем доступно проекту, или бронирование. Учитывая скорость и масштаб, с которыми BigQuery работает, многие традиционные проблемы рабочей нагрузки, такие как поддержание отдельных очередей для разных рабочих нагрузок не применимы. Если вам нужен явный запрос расставляя приоритеты, вы можете разделить важные рабочие нагрузки в проект с отдельная оговорка.
Мониторинг и аудит
Вы можете отслеживать BigQuery, используя мониторинг, где различные диаграммы и предупреждения определяются на основе Метрики BigQuery. Например, вы можете отслеживать пропускную способность системы с помощью метрики «Время запроса» или Визуализируйте тенденции спроса на запросы на основе метрики Slots Allocated. Когда ты нуждаешься Чтобы заранее спланировать сложный запрос, вы можете использовать метрику «Доступные слоты». К оставайтесь активными в отношении работоспособности системы, вы можете создавать оповещения на основе пороговых значений, которые вы определяете.Мониторинг обеспечивает самообслуживание Интернет-портал.
BigQuery автоматически создает журналы аудита действий пользователей. Ты может экспортировать журналы аудита в другой набор данных BigQuery в пакете или как поток данных и используйте предпочтительный инструмент анализа для визуализации журналов. Для подробности см. Анализ журналов аудита с помощью BigQuery.
BigQuery также предоставляет INFORMATION_SCHEMA
представления только для чтения, которые можно использовать для доступа к метаданным вашего
Ресурсы BigQuery, такие как наборы данных, таблицы и задания.Эти
представления могут использоваться для различных целей, например
отслеживание срока годности вашей таблицы
или понимание
использование слотов ваших запросов.
Управление данными
В этом разделе обсуждаются соображения по проектированию схемы, как разбиение и кластерные работы и методы загрузки данных в BigQuery. В Раздел завершается рассмотрением обработки изменений на складе, пока нулевое время простоя анализа.
Схема проектирования
BigQuery позволяет указать
схема
для таблицы, когда вы загружаете в нее данные или когда вы создаете пустую таблицу.BigQuery поддерживает
Стандартные типы данных SQL
включая простые типы, такие как целые числа, и более сложные типы, такие как ARRAY
и СТРУКТУРА
.
BigQuery поддерживает традиционные модели данных, основанные на
звездная схема
и схема снежинки.
В этих моделях таблицы фактов объединены с таблицами измерений. BigQuery
также поддерживает операции INNER
, [FULL | RIGHT | LEFT] OUTER
и CROSS JOIN
.
В некоторых случаях вы можете использовать
вложенные и повторяющиеся поля
денормализовать ваши данные. Для этого вы можете использовать комбинацию ARRAY
и STRUCT
типов данных для определения вашей схемы.
Столы для перегородок
Разделенные таблицы делятся на сегменты, основанные на значении столбца раздела. Когда запрос задает фильтры в столбце раздела, только соответствующие сегменты сканируются. Такое расположение ускоряет выполнение запроса и снижает стоимость выполнения запроса. Таблицу BigQuery можно разделены следующим образом:
- Время загрузки : BigQuery автоматически загружает данные на ежедневные, основанные на дате разделы, которые отражают данные время приема или прибытия.
- Разделение на основе столбцов : Таблица разделена на
значение указанного столбца. Для столбцов можно использовать следующие типы:
- Разделы столбцов единиц времени :
Таблицы могут быть разделены на столбцы
DATE
,DATETIME
иTIMESTAMP
.-
ДАТА
: Разрешает разделы с ежедневной, ежемесячной или годовой детализацией. -
TIMESTAMP
ДАТА
: Разрешает разделы с любым типом детализации единицы времени, включаяЧАС
.
-
- Целочисленный диапазон : Таблицы разбиты на разделы по целочисленному столбцу.
- Разделы столбцов единиц времени :
Таблицы могут быть разделены на столбцы
Вы включаете секционирование в процессе создания таблицы. Кроме того, вы можете укажите срок хранения данных в разделах. Новые данные, которые вставляются в секционированную таблицу записывается в необработанный раздел во время вставки. Чтобы контролировать, в какой раздел загружаются данные, вы можете указать конкретный раздел в вашем загрузочном задании.
Таблицы кластеризации
Кластерные таблицы организованы на основе одного или нескольких указанных столбцов. BigQuery поддерживает кластеризация как для секционированных, так и для несекционированных таблиц. Кластеризация разделяет таблицу сегменты в блоки, отсортированные по полям кластеризации. Для запросов, которые фильтруют данные в кластеризованных столбцах, объем сканируемых данных уменьшается, а улучшена производительность запросов. Поскольку количество отсканированных данных может быть только определяется во время выполнения, точная стоимость выполнения запроса не может быть известна в продвигать.
BigQuery автоматически повторно кластеризует вновь вставленные данные в фон.Автоматическая повторная кластеризация не влияет на емкость запросов или ценообразование.
На следующей блок-схеме показаны лучшие варианты использования секционирования, кластеризации и и разделение плюс кластеризация в таблицах.
На предыдущей блок-схеме представлены следующие варианты:
Пример использования | Рекомендация |
---|---|
Вы используете по запросу цены и требуют строгих гарантий стоимости перед выполнением запросов. | Разделенные таблицы |
Размер вашего сегмента меньше 1 ГБ после разбиения таблицы на разделы. | Кластерные столы |
Вам требуется большое количество разделов, превышающее ограничения BigQuery | Кластерные столы |
Частые мутации в ваших данных изменяют большое количество разделов. | Кластерные столы |
Вы часто выполняете запросы для фильтрации данных по определенным фиксированным столбцам. | Разделы плюс кластеризация |
Материализованные представления
Материализованные представления предварительно вычисленные представления, которые периодически кэшируют результаты запроса для увеличения производительность и эффективность. В BigQuery материализованное представление всегда соответствует базовой таблице, включая BigQuery потоковые таблицы. Материализованные представления полезны для создания сводных таблиц. в вашем хранилище данных.
Геопространственные данные
Хранилища данных часто содержат данные о местоположении.Такие данные можно использовать в
множество способов, от обеспечения более эффективной логистической системы цепочки поставок до
планирование урагана на ветряной электростанции.
геопространственная аналитика
(Географические информационные системы) позволяет анализировать и визуализировать геопространственные данные.
в BigQuery с помощью стандартных функций географии SQL.
BigQuery предоставляет ГЕОГРАФИЯ
тип данных, который позволяет загружать пространственные данные в
GeoJSON,
общеизвестные двоичные (WKB) и общеизвестные текстовые (WKT) форматы. BigQuery также
обеспечивает несколько географических функций
которые позволяют анализировать, преобразовывать и работать с данными ГИС.Для
дополнительные сведения о работе с геопространственными данными см. в разделе Работа с геопространственной аналитикой.
Загрузка данных
BigQuery поддерживает как пакетный, так и потоковый режимы загрузки данных. Он также позволяет импортировать данные напрямую из определенных приложений SaaS, используя Служба передачи данных BigQuery. Пакетная загрузка позволяет загружать большие объемы данных, не влияя на запрос производительность и без дополнительных затрат. Для таких случаев использования, как загрузка данных изменений для обнаружение мошенничества, требующее, чтобы данные были доступны в режиме реального времени, вы можете передавать данные в BigQuery.
Пакетные загрузки
Для пакетных загрузок файлы данных размещаются в Облачное хранилище ведро, а затем импортировать в таблицы BigQuery с помощью загрузить работу. BigQuery поддерживает множество открытых форматы например CSV, JSON, Avro, ORC, и паркет. BigQuery также имеет встроенную поддержку Хранилище данных и Firestore.
BigQuery устанавливает дневные ограничения на количество и размер загружаемых заданий. которые вы можете выполнять для каждого проекта и для таблицы. Кроме того, BigQuery устанавливает ограничения на размер отдельных файлов загрузки и записи.Для получения дополнительной информации см. Квоты и лимиты.
Примечание: Поскольку для таблиц установлено жесткое ограничение в 1500 заданий загрузки в день, микродозирование не рекомендуется. Для эффективного использования большого объема или в режиме реального времени при загрузке данных используйте потоковые вставки вместо микропакетов.Вы можете запускать задания загрузки через консоль BigQuery. К автоматизировать процесс, вы можете настроить Облачные функции слушать Событие облачного хранилища который связан с поступлением новых файлов в заданный сегмент и запускает Задание загрузки BigQuery.Конвейеры данных часто используются для выполнения извлечения, преобразования и загрузки (ETL). процедура, которая выполняется вне хранилища данных. Следующая диаграмма показывает поток событий в конвейере.
Альтернативой процедуре ETL является извлечение, загрузка и преобразование (ELT) процедура. Как показано на следующей диаграмме, в процедуре ELT сначала передаются данные. загружается в хранилище данных и затем преобразуется в желаемую схему с помощью SQL-операций.
Вы можете использовать конвейеры ETL, работающие на Поток данных для автоматической загрузки данных в BigQuery с помощью Разъем ввода-вывода BigQuery предусмотрено в Apache Beam SDK.В качестве альтернативы вы также можете использовать конвейеры, построенные с помощью Apache Spark для автоматической загрузки данных в BigQuery с помощью Коннектор Spark BigQuery.
Вставки для потоковой передачи
При потоковой передаче данных в таблицы BigQuery вы отправляйте свои записи прямо в BigQuery с помощью API BigQuery. Если вы используете Cloud Logging, вы также можете транслируйте журналы своих облачных проектов прямо в BigQuery, включая журналы запросов из App Engine и информацию настраиваемого журнала, отправляемую на Ведение журнала в облаке.
Также возможна потоковая передача данных о событиях из систем обмена сообщениями с конвейерами. работает на
Поток данных
Такие как
Pub / Sub
а также
Апач Кафка
используя ПОТОКОВЫЕ ВСТАВКИ
метод
Ввод-вывод BigQuery
разъем предусмотрен в
Apache Beam
SDK.
По мере того, как предприятия начинают использовать больше сервисов Google Cloud, они часто выбирают для сбора исходных данных прямо в Большой стол, Cloud SQL, или Cloud Spanner и использовать Dataflow для извлечения, преобразования и загрузки данных в BigQuery партиями или потоками. На следующей схеме показано, как настроить конвейеры пакетной и потоковой передачи ETL с помощью Поток данных.
Импорт из приложений SaaS
BigQuery Data Transfer Service позволяет импортировать данные из источников приложений Google. такие как Google Реклама, Менеджер кампаний, Google Менеджер рекламы и YouTube.Это также поддерживает внешние источники данных Такие как Amazon S3 и хранилища данных, такие как Терадата а также Amazon Redshift. Вы также можете использовать разъемы, предоставленные нашими партнерами, для нескольких других систем. от нашего Google Cloud Marketplace.
Обработка смены
Многие хранилища данных работают в соответствии со строгими соглашениями об уровне обслуживания (SLA), практически не требует простоев. Хотя служба BigQuery имеет 99,99% времени безотказной работы SLA, вы контролируете доступность и скорость отклика ваших наборов данных с помощью подход к отражению изменения данных.
Все модификации таблиц в BigQuery, включая операции DML, запросы с таблицами назначения и задания загрузки ACID-совместимый. Таким образом, изменение таблицы не требует простоя. Однако ваш внутренний процесс может потребовать фазы тестирования и проверки перед тем, как недавно обновленные данные доступны для анализа. Кроме того, поскольку операции DML менее эффективен в аналитических базах данных, вы можете предпочесть их пакетную обработку. Вы можете применять большинство известных методов обработки изменений данных. Эта секция расширяет некоторые из известных проблем и решений.
Примечание. Мы не рекомендуем использовать BigQuery в качестве хранилища OLTP. Потому что В OLTP-хранилищах много обновлений и удалений, они не подходят для вариант использования хранилища данных. Используйте эту блок-схему чтобы помочь вам решить, какой вариант хранения лучше всего подходит для вашего варианта использования.Скользящее временное окно
Традиционное хранилище данных, в отличие от озера данных, хранит данные только для фиксированного количество времени, например, последние пять лет.В каждом цикле обновления новые данные добавляется в хранилище, и самые старые данные удаляются, сохраняя продолжительность фиксированный. Как правило, эта концепция использовалась для обхода ограничений старые технологии.
BigQuery рассчитан на масштабирование и может масштабироваться по мере увеличения размера Склад растет, поэтому нет необходимости удалять старые данные. Сохраняя весь истории, вы можете лучше понять свой бизнес. Если стоимость хранения составляет беспокойство, вы можете воспользоваться Цены на долгосрочное хранение BigQuery архивируя старые данные и используя их для специального анализа, когда возникает необходимость.Если у вас все еще есть веские причины для удаления старых данных, вы можете использовать встроенная поддержка BigQuery для таблицы с разделением по датам а также срок действия раздела. Другими словами, BigQuery может автоматически удалять старые данные.
Изменение схемы
В то время как хранилище данных проектируется и разрабатывается, типично настраивать таблицу схемы путем добавления, обновления или удаления столбцов или даже добавления или удаления целые таблицы. Если изменение не в форме добавленного столбца или таблицы, оно может нарушить сохраненные запросы и отчеты, которые ссылаются на удаленную таблицу, переименованную столбец и другие связанные элементы.
После запуска хранилища данных такие изменения проходят строгую Смени управление. По большей части изменения схемы планируются как версия обновления. Вы проектируете, разрабатываете и тестируете обновление параллельно, пока предыдущая версия хранилища данных обслуживает рабочие нагрузки анализа. Ты следуйте тому же подходу при применении изменений схемы к BigQuery. хранилище данных.
Медленно меняющиеся размеры
Нормализованная схема данных сводит к минимуму влияние медленно меняющиеся размеры (SCD) путем выделения изменения в таблицах размеров.Обычно это выгодно по сравнению с денормализованная схема, где SCD может вызвать массовые обновления плоского факта стол.
Нет единого решения для всех случаев медленно меняющихся размеров. Важно понять характер изменения и применить наиболее подходящее решение или комбинации решений вашей проблемы. Остальная часть этого раздела описывает несколько решений и способы их применения к типам SCD.
SCD тип 1: перезапись
SCD типа 1 перезаписывает значение атрибута новыми данными без ведение истории. Этот подход особенно полезен, когда размер таблицы отражают рабочие первичные таблицы. Например, если товар «классный» увлажняющий крем »входил в категорию« здоровье и красота »и теперь из категории «косметика» изменение выглядит следующим образом:
Раньше:
PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY |
---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | здоровье и красота |
После:
PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY |
---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | здоровье и красота косметика |
Если атрибут находится в нормализованной таблице измерения, изменение изолированные.Вы просто обновляете затронутую строку в таблице измерений.
Для нечастых изменений в определенных строках можно использовать UPDATE DML
утверждение.
обновить mydataset.dimension_table set PRD_CATEGORY = "cosmetics", где PRD_SK = "123"
Могут быть случаи, когда нужно периодически синхронизировать измерение с оперативная первичная таблица. Распространенная схема — периодически объединять дампы. из вашей оперативной базы данных в таблицу измерений BigQuery.Вы можете загрузить новые данные во временную таблицу или создать внешний стол указывая на данные.
Таблица размеров:
PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY |
---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | здоровье и красота |
124 | PQR | awesome lotion — 50 унций | здоровье и красота |
Временный стол:
PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY |
---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | косметика |
124 | PQR | awesome lotion — 50 унций | косметика |
125 | XYZ | футболка acme — xl | одежда |
Теперь вы можете запустить запрос на слияние, чтобы обновить таблицу измерений, а затем отбросить временная таблица.
MERGE my-dataset.dimension_table как MAIN, используя
my-dataset. Contemporary_table как TEMP
на MAIN.PRD_SK = TEMP.PRD_SK
при совпадении тогда
ОБНОВЛЕНИЕ НАБОР
MAIN.PRD_CATEGORY = TEMP.PRD_CATEGORY
когда не совпадает тогда
ВСТАВИТЬ ЗНАЧЕНИЯ (TEMP.PRD_SK, TEMP. PRD_ID, TEMP. PRD_SK, TEMP.
PRD_CATEGORY)
Таблица размеров результата:
PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY |
---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | здоровье и красота косметика |
124 | PQR | awesome lotion — 50 унций | здоровье и красота косметика |
125 | XYZ | футболка acme — xl | одежда |
SCD, тип 2: ведение журнала строк
Этот метод отслеживает неограниченное количество исторических данных, создавая несколько записей для данный естественный ключ с отдельными суррогатными ключами. Например, то же изменение, которое проиллюстрировано в SCD типа 1, будет обработано как показано ниже:
Раньше:
PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY | START_DATE | END_DATE |
---|---|---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | здоровье и красота | 31 января 2009 г. | ПУСТО |
После:
PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY | START_DATE | END_DATE |
---|---|---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | здоровье и красота | 31 января 2009 г. | 18-ИЮЛ-2017 |
124 | ABC | awesome увлажняющий крем — 100 унций | косметика | 19-ИЮЛ-2017 | ПУСТО |
Вы можете создать представление или материализованное представление поверх этой таблицы и использовать его в ваших аналитических запросах.
создать view products_current как
выберите PRD_SK, PRD_ID, PRD_DESC, PRD_CATEGORY, PRD_START_DATE
из my-dataset.dimension_table
где END_DATE IS NULL
Если атрибут внедрен в таблицу фактов денормализованным способом, ситуация может быть более благоприятной, если вы не поддерживаете явное начало и даты окончания для стоимости, а вместо этого полагаются на даты транзакции. Потому что предыдущее значение остается верным для даты и времени предыдущих транзакций произошла, вам не нужно изменять предыдущие строки таблицы фактов.Таблица фактов будет выглядеть следующим образом:
TRANSACTION_DATE | PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY | ЕДИНИЦ | СУММА |
---|---|---|---|---|---|---|
18-ИЮЛ-2017 | 123 | ABC | awesome увлажняющий крем — 100 унций | здоровье и красота | 2 | 25,16 |
19-ИЮЛ-2017 | 124 | ABC | awesome увлажняющий крем — 100 унций | косметика | 1 | 13.50 |
SCD, тип 3: ведение журнала путем добавления столбцов
Этот метод отслеживает ограниченные исторические данные, используя отдельные столбцы для
сохранить ограниченную историю. Поскольку BigQuery поддерживает вложенные и
повторяющиеся поля, можно вести историю в том же столбце, используя
тип массива
в порядке возрастания на значение START_DATE
. Как и в случае с SCD типа 2, вы можете создать
представление или материализованное представление в верхней части таблицы, чтобы упростить создание
запрос.
Базовый стол:
PRD_SK | PRD_ID | PRD_DESC | PRD_CATEGORY | ||
---|---|---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | CATEGORY_NAME | START_DATE | END_DATE |
здоровье и красота | 31 января 2009 г. | 18 июля 2017 г. | |||
косметика | 18 июля 2017 г. | ПУСТО |
Создайте представление, чтобы выбрать имя последней категории продуктов в PRD_CATEGORY
массив:
создать представление my-dataset.products_current как
выберите PRD_SK, PRD_ID, PRD_DESC,
PRD_CATEGORY.ordinal [длина_массива (PRD_CATEGORY)] как PRD_CAT
из my-dataset.dimension_table;
Просмотр:
PRD_SK | PRD_ID | PRD_DESC | PRD_CAT |
---|---|---|---|
123 | ABC | awesome увлажняющий крем — 100 унций | косметика |
Репликация почти в реальном времени
Для случаев, когда вам нужно, чтобы обновленные данные из вашей оперативной базы доступны для анализа в режиме, близком к реальному времени, вы можете использовать Репликация базы данных в BigQuery с использованием системы отслеживания измененных данных (CDC).
Запрос данных
BigQuery поддерживает стандартные запросы SQL и совместим с ANSI SQL 2011. BigQuery Справочник по SQL предоставляет исчерпывающее описание всех функций, операторов и обычных поддерживаемые возможности выражения.
Примечание: До поддержки стандартного SQL поддерживался BigQuery. альтернативная версия SQL, которая теперь называется Legacy SQL . Мы рекомендуем используя обновленный стандарт SQL в ваших запросах. Для получения дополнительной информации см. Включение стандартного SQL. Поскольку BigQuery поддерживает вложенные и повторяющиеся поля как часть
модель данных, ее поддержка SQL была расширена специально для поддержки этих
типы полей. Например, используя
Общедоступный набор данных GitHub,
вы могли бы выпустить UNNEST
команда, которая позволяет перебирать повторяющееся поле:
ВЫБРАТЬ
name, count (1) как num_repos
ИЗ
`bigquery-public-data.github_repos.languages`, UNNEST (язык)
ГРУППА ПО ИМЕНИ
ЗАКАЗАТЬ ПО num_repos
Предел DESC 10
Интерактивные запросы
Веб-консоль BigQuery позволяет интерактивно запрашивать наборы данных. и предоставляет консолидированное представление наборов данных по проектам, которые у вас есть доступ к.Консоль также предоставляет несколько полезных функций, таких как сохранение и обмен специальными запросами, настройка и редактирование исторических запросов, изучение таблиц и схемы, и сбор метаданных таблицы. Обратитесь к Веб-консоль BigQuery Больше подробностей.
Пользовательские функции
BigQuery также поддерживает
определяемые пользователем функции (UDF)
для запросов, в которых нецелесообразно выражать функцию в операторе SQL.
UDF позволяют расширять встроенные функции SQL; они принимают список ценностей,
который может быть типа ARRAY
или STRUCT
и возвращать одно значение, которое может
также быть типом ARRAY
или STRUCT
.UDF могут быть написаны на стандартном SQL и
JavaScript. В UDF JavaScript вы можете включать внешние ресурсы, такие как
шифрование или другие библиотеки. Мы рекомендуем использовать стандартные пользовательские функции SQL, поскольку
они более производительны, чем UDF в JavaScript. Примеры некоторых часто встречающихся
использовали UDF, созданные и поддерживаемые командой Google Cloud Professional Services,
см. страницу bigquery-utils на GitHub.
Сценарии и хранимые процедуры
Корпоративные пользователи часто выполняют сложную логику внутри хранилищ данных.Создание сценариев BigQuery позволяет писать стандартные сценарии SQL, которые обеспечивают использование переменных и операторы управления и выполнять их внутри данных BigQuery. склад. Хранимые процедуры позволяют сохранять эти сценарии для запуска в BigQuery в будущих сценариях использования. Подобно представлениям, вы также можете делиться хранимой процедурой с другими в вашей организации, сохраняя при этом одну канонический вариант процедуры. Вы можете найти образцы сценариев и сохранить процедуры по bigquery-utils Страница GitHub.
Автоматические запросы
Обычно автоматизируют выполнение запросов на основе расписание или событие и кэшировать результаты для последующего использования.Вы можете использовать Запланированные запросы BigQuery для периодического запуска языка определения данных (DDL) и Язык обработки данных (DML) заявления.
Для простых оркестровок, таких как автоматизация заданий загрузки из Сегмент Cloud Storage, вы можете использовать Триггер облачного хранилища для запуска облачной функции, который выполняет задание BigQuery. Для запланированных заданий вы можете активировать Облачная функция из Облачный планировщик. Для более сложных рабочих процессов вы можете использовать Cloud Composer для организации других автоматизированных действий с помощью Операторы Airflow BigQuery.
API хранилища BigQuery
На предприятиях часто встречаются конвейеры, которым требуется считывать большие объемы данных. данных из BigQuery. API хранилища BigQuery позволяет читать параллельные потоки сериализованных структурированных данных. Этот подход помогает преодолеть ограничения производительности чтения строк с разбивкой на страницы и накладные расходы на экспорт данных в облачное хранилище.
Существующие трубопроводы, построенные с использованием Apache Beam или Apache Spark может использовать BigQuery Storage API практически без дополнительной настройки.
Оптимизация запросов
Чтобы понять характеристики производительности после выполнения запроса, см. Подробные объяснение плана запроса. В объяснении разбиваются этапы, через которые прошел запрос, количество строк ввода / вывода, обрабатываемых на каждом этапе, и временного профиля в каждом сцена. Использование результатов объяснения может помочь вам понять и оптимизируйте свои запросы.
Уменьшить сканирование данных
BigQuery не использует и не поддерживает индексы.Каждый раз, когда он запускает запрос, он выполняет сканирование всего столбца. Потому что BigQuery производительность и стоимость запросов зависят от количества данных, сканируемых во время запроса, мы рекомендуем создавать запросы так, чтобы они ссылались только на столбцы, релевантные запросу. Когда вы используете секционированные таблицы, только просканируйте соответствующие разделы. Вы можете избежать нежелательного сканирования, используя перегородка фильтры на основе столбца раздела. Если у вас есть запросы, которые часто фильтруются по определенным столбцам, рассмотрите кластеризация стол.Если вам нужно часто выполнять агрегированный запрос для дальнейшего обработки, рассмотрите возможность материализации запроса. Такой подход снижает вычислительные требования, а также объем сканируемых данных.
Снижение требований к вычислениям
Мы рекомендуем избегать использования пользовательских функций JavaScript. В любое время
вы можете сделать это, вместо этого используйте стандартные SQL UDF. Другой способ
Ускорить запросы — использовать приблизительные агрегаты, например APPROX_COUNT_DISTINCT
вместо COUNT (DISTINCT)
.
Улучшить производительность соединения
Предприятиям часто требуется объединить несколько таблиц, особенно когда хранилища данных
иметь звездную схему или схему снежинки. Таблица фактов обычно больше, чем
таблицы размеров. В схеме снежинки, потому что размеры
нормализованные, у вас могут быть даже меньшие таблицы измерений. Лучше всего
начните с таблицы фактов слева и присоедините к ней меньшее измерение
таблицы справа в порядке убывания размера. Когда у вас большой стол на
левая сторона JOIN
и маленькая справа от JOIN
,
широковещательное соединение создано.Широковещательное соединение отправляет все данные в меньшем
table в каждый слот, который обрабатывает большую таблицу.
Для получения дополнительной информации см. Перенос хранилищ данных на BigQuery: оптимизация производительности.
Внешние источники
Для случаев использования, когда вы хотите присоединиться к небольшой, часто меняющейся операционной table с вашими таблицами BigQuery, BigQuery поддерживает внешние источники данных, такие как Облако Bigtable а также Cloud SQL. Такой подход гарантирует, что данные не нужно перезагружать каждый раз, когда они обновлено.
Поскольку BigQuery поддерживает запросы данных во многих форматах, таких как Avro, Parquet и ORC, вы можете использовать его для преобразования данных и загрузки в BigQuery от Гугл драйв или Облачное хранилище за один проход. Также можно запрашивать данные из существующего озера данных в Облачное хранилище от BigQuery, следующее за секционированная компоновка улья по умолчанию. Например, таблица в озере корпоративных данных хранится в Сегмент Cloud Storage в формате Parquet со следующим Hive схема разделения:
gs: // my_bucket / my_table / {dt: DATE} / {val: STRING}
Чтобы сделать запрос, пользователь может создать внешнюю таблицу в BigQuery с шаблоном разделения Hive.Когда пользователь выполняет запросы к этой таблице, BigQuery учитывает раздел улья схемы и уменьшает количество сканируемых данных.
Это особенно полезно при переносе хранилища данных на BigQuery поэтапно, так как вы можете перенести все запросы в BigQuery без перемещения ваших данных.
Для получения дополнительной информации о внешних источниках данных в BigQuery, видеть Введение во внешние источники данных.
Совместное использование запросов
BigQuery позволяет сотрудникам сохранять и обмениваться запросами между Члены команды.Эта функция может быть особенно полезна при исследовании данных. упражнения или как средство ускорить работу над новым набором данных или шаблоном запроса. Для получения дополнительной информации см. Сохранение и отправка запросов.
Анализ данных
В этом разделе представлены различные способы подключения к BigQuery и проанализируйте данные. Чтобы в полной мере воспользоваться BigQuery как аналитический движок, вы должны хранить данные в Хранилище BigQuery. Однако ваш конкретный вариант использования может принести пользу от анализа внешних источников либо самих по себе, либо СОЕДИНЯЯСЬ с данными в Хранилище BigQuery.
Стандартные инструменты
Google Data Studio, Смотритель, а также многие партнерские инструменты которые уже интегрированы с BigQuery, можно использовать для рисования аналитика из BigQuery и создание сложных интерактивных данных визуализации. Если вы знакомы с интерфейсами электронных таблиц, вы можете получить доступ, анализировать, визуализировать и обмениваться данными в BigQuery из Таблицы с использованием Подключенные таблицы.
Если вы оказались в ситуации, когда вам нужно выбрать инструмент, вы можете найти исчерпывающее сравнение поставщиков в Отчет Gartner по магическому квадранту а также Отчет о результатах G2 пользователя G2 Crowd.Отчет Gartner можно получить на многих наших партнерских сайтах, Такие как Tableau.
Разработка под заказ
Чтобы создавать собственные приложения и платформы на основе BigQuery, вы можете использовать клиентские библиотеки, которые доступны для большинства распространенных языков программирования, или вы можете использовать BigQuery REST API напрямую. Для примера см. Создание настраиваемых интерактивных панелей мониторинга с помощью Bokeh и BigQuery, который использует библиотеки Python для подключения к BigQuery и создания настраиваемые интерактивные информационные панели.
Примечание: Все способы подключения к BigQuery по существу предоставить оболочку BigQuery REST API. Все подключения к API BigQuery зашифрованы с использованием HTTPS и требуют разрешений используя Политики IAM.Сторонние разъемы
Чтобы подключиться к BigQuery из приложения, которое не является исходным интегрированный с BigQuery на уровне API, вы можете использовать Драйверы BigQuery JDBC и ODBC. Драйверы обеспечивают мост для взаимодействия с BigQuery для устаревших версий. приложения или приложения, которые нельзя легко изменить, например Майкрософт Эксель.Хотя ODBC и JDBC поддерживают взаимодействие с BigQuery с помощью SQL, драйверы не так выразительны, как работа с API напрямую.
Стоимость
Большинство хранилищ данных обслуживают несколько бизнес-структур внутри организации. Распространенной проблемой является анализ операционных затрат на бизнес-субъект. Для руководство по разделению счета и отнесению затрат к потреблению см. Визуализируйте биллинг Google Cloud с помощью BigQuery и Data Studio.
Для BigQuery существует три основных параметра затрат: загрузка, стоимость хранения и запросов.Проект, которому принадлежит BigQuery набор данных оплачивается по стандартной ежемесячной ставке за хранение. Проект, положивший начало запрос или нагрузка оплачивается по стоимости вычислений. В этом разделе обсуждается каждый размер в деталях.
Хранение данных
Стоимость хранилища указана пропорционально за Мбит / с.
Если таблица не редактировалась 90 дней подряд, она классифицируется как длительное хранение, и стоимость хранения для этого стола автоматически снижается на 50 процентов до 0,01 доллара США за ГБ в месяц.Нет снижения производительности, долговечность, доступность или любые другие функции, когда рассматривается таблица длительное хранение.
Когда данные в таблице изменяются, BigQuery сбрасывает таймер. в таблице, и любые данные в таблице возвращаются к нормальной цене хранения. Действия, которые напрямую не управляют данными, такие как запросы и создание просмотров, не сбрасывайте таймер. Для секционированных таблиц та же модель применяется к отдельные сегменты перегородки.
Для получения дополнительной информации см. Цены на хранилище BigQuery.
Загрузка данных
Вы можете загружать данные в BigQuery с помощью обычного загрузить работу, бесплатно. После загрузки данных вы платите за хранилище, как описано в предыдущем разделе.
Вставки для потоковой передачи оплачиваются в зависимости от объема передаваемых данных. потоковое. Подробнее см. Стоимость потоковых вставок, перечисленных в разделе Цены на хранилище BigQuery.
Запрос данных
Для запросов BigQuery предлагает две модели ценообразования: по запросу и фиксированная ставка с использованием оговорок.
Примечание: В ситуации с несколькими проектами, когда данные размещаются в одном проекте и доступны для запросов пользователям других проектов, стоимость хранения и потоковая передача осуществляется в проекте хостинга, но стоимость запросов составляет понесенные в проекте, из которого отправляется запрос.Цена по запросу
В модели по запросу BigQuery взимает плату за объем данных. доступ во время выполнения запроса. Поскольку BigQuery использует столбец формат хранения, доступны только столбцы, относящиеся к вашему запросу.если ты составлять отчеты только еженедельно или ежемесячно, и вы выполняли запросы на менее 1 ТБ ваших данных, вы можете обнаружить, что стоимость запросов в вашем счете составляет очень низко.
Для получения дополнительной информации о том, как тарифицируются запросы, см. Стоимость запросов BigQuery.
Чтобы заранее определить, какой объем данных будет сканировать любой запрос,
вы можете использовать средство проверки запросов в веб-консоли. В случае обычай
разработки, вы можете установить флаг dryRun
в запросе API и
BigQuery не выполняет задание.Вместо этого вернитесь со статистикой о
задание, например, сколько байтов будет обработано. Обратитесь к
запрос API
Больше подробностей.
Резервирование BigQuery
Для более стабильных ежемесячных расходов вы можете включить фиксированная цена через Резервирование BigQuery. С помощью этой опции вы можете приобрести обязательства по мощности для определенного числа. из Слоты BigQuery для вашей организации и назначьте их для конкретных проектов.
Вы можете брать ежемесячные или годовые обязательства. Вы также можете сделать Слот Flex обязательств, что позволяет вам покупать дополнительные слоты минимум за 60 секунд. Когда вы покупаете слоты, вы можете назначать их разным сегментам. позвонил в резервацию . Резервирование создает именованное распределение слотов. Использовать приобретенные вами слоты, вы назначаете проекты, папки или организации оговорки. Каждый уровень в иерархии ресурсов наследует назначение от уровень выше, если вы не измените эту настройку.
Вы можете использовать BigQuery Reservations, чтобы изолировать выделенную емкость между рабочими нагрузками, командами или отделами путем создания дополнительных резервирований и присвоение проектов этим резервам.
В первом примере сценария, показанном на следующем изображении, требуется 1000 слотов. для двух типов рабочих нагрузок: анализ данных (DS) и бизнес-аналитика (BI). в Во втором примере сценария требуется 1000 слотов для выполнения заданий ELT каждый час в течение 15 минут.
В первом сценарии для заданий DS и заданий BI вы должны использовать обязательства и бронирование следующим образом:
- Создайте ежемесячное или годовое обязательство на 1000 слотов.
- Создайте резервирование слота DS 500 и назначьте все соответствующие Проекты Google Cloud в резервирование DS.
- Создайте резервирование BI на 500 слотов и назначьте проекты, связанные с вашим Инструменты BI для резервирования BI.
Во втором сценарии для заданий ELT вы использовали бы обязательства и бронирование следующим образом:
- Создайте резервирование слота Flex на 1000 слотов.
- Создайте резервирование ELT с 1000 слотами и назначьте соответствующие проект в резервацию ELT.
- По завершении заданий ELT вы удаляете назначение, ELT оговорка и обязательство.
Что дальше?
Использование idsldapmodify для увеличения длины атрибута
Вопрос
Как использовать idsldapmodify для увеличения длины настраиваемого атрибута, который уже определен в схеме?
Ответ
Вы можете использовать idsldapmodify через командную строку, чтобы увеличить длину атрибута, который уже определен в схеме.Вам необходимо увеличить длину как в определениях attributetype, так и в определениях ibmattributetype соответствующего атрибута.
Самый простой способ получить необходимую информацию — выполнить поиск в схеме атрибута, который вы хотите обновить. Вот ldapsearch, который вернет данные для атрибута mynewattr.
idsldapsearch -h <имя хоста> -p <порт> -D cn = root -w <пароль> -L -b cn = schema -s base objectclass = * | grep -i mynewattr
возвращает:
attributeTypes: (mynewattr-oid ИМЯ ‘mynewattr’ DESC ‘test attr newone’ SYNTAX 1.3.6.1.4.1.1466.115.121.1.15 {5})
IBMattributeTypes: (mynewattr-oid DBNAME (‘mynewattr’ MYNEWATTR ‘) КЛАСС ДОСТУПА НОРМАЛЬНАЯ ДЛИНА 5)
Скопируйте и вставьте типы атрибутов и ibmattributetypes в файл ldif, modattr.ldif. Обратите внимание, что это синтаксис строки каталога. Текущая длина атрибута — 5. Чтобы изменить длину до 15, отредактируйте файл ldif, изменив длину в строках attributetypes и ibmattributetypes с 5 на 15. Вот как будет выглядеть файл ldif:
dn: cn = схема
changetype: изменить
заменить: attributetypes
attributetypes: (mynewattr-oid ИМЯ ‘mynewattr’ DESC ‘test attr newone’ SYNTAX 1.3.6.1.4.1.1466.115.121.1.15 {15})
—
заменить: ibmattributetypes
IBMattributeTypes 🙁 mynewattr-oid DBNAME (‘mynewattr’ ‘MYNEWATTR’) КЛАСС ДОСТУПА НОРМАЛЬНАЯ ДЛИНА 15)
Это команда, которую нужно запустить для внесения фактических изменений.
idsldapmodify -D cn = root -w secret -f modatt.ldif
Повторный поиск, чтобы убедиться, что длина увеличена до 15:
idsldapsearch -h <имя хоста> -p <порт> -D cn = root -w <пароль> -L -b cn = schema -s base objectclass = * | grep -i mynewattr
возвращает:
attributeTypes: (mynewattr-oid NAME ‘mynewattr’ DESC ‘test attr newone’ СИНТАКСИС 1.3.6.1.4.1.1466.115.121.1.15 {15})
IBMattributeTypes: (mynewattr-oid DBNAME (‘mynewattr’ MYNEWATTR ‘) НОРМАЛЬНАЯ ДЛИНА КЛАССА ДОСТУПА 15)
Примечание: В системах SDS VA 8.0.1. * , Используйте sds client_tools, чтобы войти в подсказку client_tools, а затем выполните приведенные выше команды.
[{«Продукт»: {«код»: «SSVJJU», «ярлык»: «IBM Security Directory Server»}, «Бизнес-подразделение»: {«код»: «BU008», «ярлык»: «Безопасность»}, «Компонент»: «Общие», «Платформа»: [{«код»: «PF025», «метка»: «Независимая от платформы»}], «Версия»: «6.0; 6.1; 6.2; 6.3; 6.3.1; 6.4; 8.0.1 «,» Редакция «:» «,» Сфера деятельности «: {» code «:» LOB24 «,» label «:» Программное обеспечение безопасности «} }]
Данные, ориентированные на запись с NiFi: Apache NiFi
Данные, ориентированные на запись с NiFi
Марк Пейн — @dataflowmark
Intro — The What
Apache NiFi используется многими компаниями и организациями для распределения данных. потребности. Одна из сильных сторон NiFi заключается в том, что структура не зависит от данных.Неважно, какой тип данных, которые вы обрабатываете. Есть процессоры для обработки JSON, XML, CSV, Avro, изображений и видео и несколько других форматов. Также существует несколько процессоров общего назначения, таких как RouteText и CompressContent. Данные могут быть сотнями байтов или многими гигабайтами. Это делает NiFi мощный инструмент для извлечения данных из внешних источников; маршрутизация, преобразование и агрегирование; и, наконец, доставить его в конечный пункт назначения.
Хотя эта способность обрабатывать любые произвольные данные является невероятно мощной, мы часто видим, как пользователи работают с данными, ориентированными на запись.То есть большие объемы небольших «записей», «сообщений» или «событий». У каждого свой способ говорить об этих данных, но мы все имеем в виду одно и то же. Много действительно небольшие, часто структурированные фрагменты информации. Эти данные бывают разных форматов. Наиболее часто, мы видим CSV, JSON, Avro и данные журнала.
Хотя NiFi упрощает множество задач, есть несколько общих задач, которые мы можем выполнить. лучше с. Итак, в версии 1.2.0 NiFi мы выпустили новый набор сервисов процессоров и контроллеров, для работы с данными, ориентированными на запись.Новые процессоры оснащены устройством чтения записей. и служба контроллера записи записей. Есть считыватели для JSON, CSV, Avro и данных журнала. Там являются писателями для JSON, CSV и Avro, а также писателями, которые позволяют пользователям вводить текст в произвольной форме. Это можно использовать для записи данных в формате журнала, например, в формате чтения, или в любом другом настраиваемом текстовом формате.
Почему
Эти новые процессоры создают потоки сборки для обработки этих данных. проще.Это также означает, что мы можем создавать процессоры, которые принимают любой формат данных без необходимости беспокоиться о логике синтаксического анализа и сериализации. Еще одним большим преимуществом этого подхода является то, что мы могут увеличивать размер FlowFiles, каждая из которых состоит из нескольких записей, что значительно улучшает представление.
The How — Объяснение
Чтобы разобраться в данных, читатели и писатели должны знать схему, которая связана с ними. с данными.Некоторые считыватели (например, Avro Reader) позволяют считывать схему из самих данных. Схема также может быть включена как атрибут FlowFile. Однако в большинстве случаев его будут искать имя из реестра схемы. В этой версии NiFi существуют две реализации реестра схем: на основе Avro. Служба реестра схем и клиент для внешнего реестра схем Hortonworks.
Поначалу настройка всего этого может показаться немного сложной. Но как только вы сделаете это один или два раза, он становится довольно быстрым и легким в настройке.Здесь мы рассмотрим, как настроить локальный реестр схем. сервис, настройте Record Reader и Record Writer, а затем начните использовать некоторые очень мощные процессоры. В этом посте мы постараемся упростить процесс. Мы получим данные CSV из файла, а затем используйте устройства чтения и записи записей для преобразования данных в JSON, которые затем мы запишем в новый каталог.
The How — Урок
Чтобы начать чтение и запись данных, как упоминалось выше, нам понадобится Record Reader.
услуга.Мы хотим проанализировать данные CSV и превратить их в данные JSON. Для этого нам понадобится CSV Reader.
и писатель JSON. Итак, мы начнем с нажатия значка «Настройки» на нашей палитре Operate
.
Это позволит нам начать настройку наших служб контроллера. Когда мы нажимаем кнопку «Добавить» в
В правом верхнем углу мы видим множество вариантов для служб контроллера:
Поскольку мы знаем, что хотим читать данные CSV, мы можем ввести «CSV» в поле «Фильтр» в правом верхнем углу. диалогового окна, и это довольно хорошо сузит наш выбор:
Мы выберем добавление службы CSVReader, а затем настроим службу контроллера.На вкладке «Свойства» у нас есть много разных свойств, которые мы можем установить:
К счастью, большинство этих свойств имеют значения по умолчанию, которые подходят для большинства случаев, но вы можете выбрать, какие символ-разделитель, который вы хотите использовать, если это не запятая. Вы можете выбрать, пропускать ли первую строку, обрабатывать его как заголовок и т. д. В моем случае я установлю для свойства «Пропустить строку заголовка» значение «true», потому что мои данные содержат строку заголовка что я не хочу обрабатывать как запись.Однако первые свойства очень важны. Используется «Стратегия доступа к схеме» чтобы проинструктировать читателя о том, как получить схему. По умолчанию он установлен на «Использовать строковые поля из заголовка». С мы также собираемся записывать данные, хотя нам все равно придется настроить схему. Итак, для этой демонстрации мы будем измените эту стратегию на «Использовать свойство« Имя схемы »». Это означает, что мы собираемся искать схему из Schema Реестр. В результате нам нужно создать реестр схем.Если мы нажмем на «Реестр схем» свойство, мы можем выбрать «Создать новую услугу …»:
Мы выберем создание AvroSchemaRegistry. Здесь важно отметить, что мы читаем данные CSV и пишем Данные JSON — так почему мы используем реестр схем Avro? Поскольку этот реестр схем позволяет нам передавать схему используя формат Apache Avro Schema, но он ничего не подразумевает о формате считываемых данных. Формат Avro используется потому, что это уже хорошо известный способ хранения схемы данных.
После того, как мы добавили наш реестр схем Avro, мы можем настроить его и увидеть на вкладке «Свойства», что у него нет свойств. вообще. Мы можем добавить схему, добавив новое определяемое пользователем свойство (нажав кнопку «Добавить» / «Плюс» в правом верхнем углу). угол). Мы дадим нашей схеме имя «demo-schema», используя это как имя свойства. Затем мы можем ввести или вставить в нашей схеме. Для тех, кто не знаком со схемами Avro, это представление в формате JSON с синтаксисом наподобие следующий:
{
"name": "recordFormatName",
"пространство имен": "нифи.Примеры",
"тип": "запись",
"поля": [
{"name": "id", "type": "int"},
{"name": "firstName", "type": "string"},
{"name": "lastName", "type": "string"},
{"name": "email", "type": "string"},
{"имя": "пол", "тип": "строка"}
]
}
Здесь у нас есть простая схема типа «запись». Обычно это так, поскольку нам нужно несколько полей. Мы тогда укажите все поля, которые у нас есть.Существует поле с именем «id» типа «int», а все остальные поля имеют тип «string». См. Документацию по схеме Avro для получения дополнительной информации. Теперь мы настроили нашу схему! Теперь мы можем включить наши службы контроллера.
Теперь мы также можем добавить нашу службу контроллера JsonRecordSetWriter. Когда мы настраиваем этот сервис, мы видим знакомые параметры для указания того, как определить схему. Для «Стратегии доступа к схеме» мы снова будем использовать «Использовать свойство« Имя схемы »». что по умолчанию.Также обратите внимание, что значение по умолчанию для свойства «Имя схемы» использует язык выражений для ссылки атрибут с именем «schema.name». Это обеспечивает очень хорошую гибкость, потому что теперь мы можем повторно использовать наши устройства чтения и записи записей. и просто передайте схему с помощью процессора UpdateAttribute, чтобы указать имя схемы. Нет необходимости продолжать создание записи Читатели и писатели. Мы установим свойство «Schema Registry» на AvroSchemaRegistry, которое мы только что создали и настроили.
Поскольку это средство записи записей, а не средство чтения записей, у нас также есть еще одно интересное свойство: «Стратегия записи схемы». Теперь, когда мы настроили, как определять схему данных, нам нужно сообщить автору, как передать эту схему следующему потребитель данных. Вариант по умолчанию — добавить имя схемы в качестве атрибута. Мы примем значение по умолчанию. Но мы также можно записать всю схему как атрибут FlowFile или использовать некоторые стратегии, которые полезны для взаимодействия с Hortonworks Реестр схем.
Теперь, когда мы все настроили, мы можем применить настройки и запустить наш JsonRecordSetWriter. Теперь у нас есть все Установлены и включены службы контроллера:
А теперь самое интересное — построить наш поток! Вышеупомянутое, вероятно, займет около 5 минут, но это делает раскладку потока супер легкий! Для нашей демонстрации у нас будет процессор GetFile, который будет загружать данные в наш поток. Мы будем использовать UpdateAttribute, чтобы добавить «schema.name» атрибут «demo-schema», потому что это имя схемы, которую мы настроили в нашем реестре схем:
Затем мы воспользуемся процессором ConvertRecord для преобразования данных в JSON.Наконец, мы хотим записать данные с помощью PutFile:
Однако нам все еще нужно настроить наш процессор ConvertRecord. Для этого все, что нам нужно настроить в Свойствах tab — это средство чтения и записи записей, которое мы уже настроили:
Теперь, запустив процессоры, мы можем видеть, как данные проходят через нашу систему!
Кроме того, теперь, когда мы определили этих читателей и писателей, а также схему, мы можем легко создать JSON Reader и Например, Avro Writer.А добавление дополнительных процессоров для разделения данных, запроса и маршрутизации данных становится очень просто, потому что мы уже сделали «сложную» часть.
Заключение
В версии 1.2.0 Apache NiFi мы представили несколько новых сервисов контроллеров и процессоров, которые сделают управление потоки данных, которые обрабатывают данные, ориентированные на записи, намного проще. Я полностью ожидаю, что в следующем выпуске Apache NiFi будет несколько дополнительные процессоры, основанные на этом.Здесь мы лишь прикоснулись к той силе, которую это нам дает. Мы можем больше узнать о том, как мы можем преобразовывать и маршрутизировать данные, разделять данные и переносить схемы. В это время, каждая из служб контроллера для чтения и записи записей и большинство новых процессоров, которые используют эти сервисы имеют достаточно обширную документацию и примеры. Чтобы увидеть эту информацию, вы можете щелкнуть правой кнопкой мыши процессор и щелкните «Использование» или щелкните значок «Использование» в левой части службы контроллера в диалоговом окне конфигурации.Оттуда, щелкнув ссылку «Дополнительные сведения …» в описании использования компонента, вы получите довольно обширную документацию. Например, JsonTreeReader предоставляет обширные знания в своих Дополнительные детали.
Отправлено в 14:18 21 мая 2017 г. от [email protected] в Dataflow |
схем в психологии: определение, типы и примеры — видео и стенограмма урока
Типы схем
Схемы можно разделить на разные типы.Давайте посмотрим на четыре распространенных типа схем.
Схемы ролей помогают людям понять социальный контекст, в котором они участвуют, и приспособиться к требованиям ситуации. Например, если Джо работает врачом, он демонстрирует свою профессиональную роль в больнице, но, вероятно, ведет себя иначе, находясь с семьей в отпуске. Как наблюдатели, наши ожидания относительно того, как он должен действовать, различаются в зависимости от социальной ситуации.
Мы не только формируем ожидания в отношении других людей, основанные на той социальной роли, которую они занимают, мы формируем ожидания в отношении их поведения, основанные на их личностных качествах.Итак, если Салли по природе своей застенчива и тиха, то люди, которые ее знают, ожидают, что Салли будет вести себя на вечеринке, полной незнакомцев. Если она вдруг станет очень общительной на вечеринке, это станет большим сюрпризом для ее друзей!
У нас также есть схемы о себе. Подобно тому, как мы ожидаем, что другие будут действовать в определенных ситуациях, у нас есть ожидания относительно того, как мы должны действовать в различных ситуациях. Если я считаю, что я общительный и люди любят разговаривать со мной на вечеринках, то я буду чувствовать себя обязанным изменить свое поведение, чтобы оно соответствовало этой схеме «я».
Схемы для определенных событий иногда называют скриптами. Подобно схемам черт личности, схемы событий основаны на ожиданиях того, как вести себя в различных ситуациях. Они основаны на наших ассоциациях с тем, как события «должны» разворачиваться, на основе нашего предыдущего опыта с событиями, которые мы воспринимаем как похожие. Схемы событий очень сильны.
Примеры схем
Большинство людей, которые когда-либо работали, имели более одной работы. Вспомните, когда вы начали свою вторую работу.Если у вас был успешный первый опыт работы, то, даже не зная об этом, ваш мозг разработал схему, основанную на том, что необходимо для работы. Вы, вероятно, знали, что было бы неплохо пойти к своему менеджеру, чтобы получить задания на день, у вас, вероятно, было ощущение, что в какой-то момент в течение дня будут перерывы, и вы, вероятно, ожидали, что в какой-то момент вам заплатят за твоя работа. Эти ожидания относительно того, чего ожидать, являются схемой. Даже несмотря на то, что вы ни дня не работали в новой компании, у вас все еще было общее представление о том, как все должно работать.
Поездки — это весело, правда? Поездка неизбежно приведет к нескольким остановкам по пути, чтобы заправить бензобак. Если вы едете в Колорадо и вам нужно заправиться в Айове, как вы узнаете, как управлять бензоколонкой на заправочной станции, которую вы никогда не посещали? Опять же, у вас есть схема перекачки газа, и она может оказаться большим подспорьем на заправочной станции, которую вы никогда не посещали. Несмотря на то, что могут быть некоторые различия в том, как управлять бензоколонкой в Айове, ваш мозг создал схему, которая включает в себя, как подойти к насосу, когда вы въезжаете, где припарковаться, как запускать и останавливать подачу газа и как платить.Все это основано на вашем прошлом опыте работы на заправках! Незначительные отличия от вашей местной заправочной станции, вероятно, будут существовать, но схема, которую вы создали для перекачки газа, позволит вам быстро закачивать газ и продолжать свой путь намного быстрее, чем если бы вам пришлось изучать весь процесс, как если бы это был первый раз.
Краткое содержание урока
Схемы — это мысленные представления сценариев, которые могут быть полезны при проведении людей в различных ситуациях.Схемы создаются на основе опыта и сохраняются в памяти для использования в будущем. Схемы позволяют нам быстро ориентироваться в различных ситуациях, которые напоминают знакомые. Схема для ресторанов позволяет человеку знать, как пообедать в ресторане, с которым он никогда раньше не сталкивался.