]> git.mxchange.org Git - quix0rs-gnu-social.git/blob - lib/mysqlschema.php
Some more poking at schema stuff, on the road towards a more portable table-modificat...
[quix0rs-gnu-social.git] / lib / mysqlschema.php
1 <?php
2 /**
3  * StatusNet, the distributed open-source microblogging tool
4  *
5  * Database schema utilities
6  *
7  * PHP version 5
8  *
9  * LICENCE: This program is free software: you can redistribute it and/or modify
10  * it under the terms of the GNU Affero General Public License as published by
11  * the Free Software Foundation, either version 3 of the License, or
12  * (at your option) any later version.
13  *
14  * This program is distributed in the hope that it will be useful,
15  * but WITHOUT ANY WARRANTY; without even the implied warranty of
16  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17  * GNU Affero General Public License for more details.
18  *
19  * You should have received a copy of the GNU Affero General Public License
20  * along with this program.  If not, see <http://www.gnu.org/licenses/>.
21  *
22  * @category  Database
23  * @package   StatusNet
24  * @author    Evan Prodromou <evan@status.net>
25  * @copyright 2009 StatusNet, Inc.
26  * @license   http://www.fsf.org/licensing/licenses/agpl-3.0.html GNU Affero General Public License version 3.0
27  * @link      http://status.net/
28  */
29
30 if (!defined('STATUSNET')) {
31     exit(1);
32 }
33
34 /**
35  * Class representing the database schema
36  *
37  * A class representing the database schema. Can be used to
38  * manipulate the schema -- especially for plugins and upgrade
39  * utilities.
40  *
41  * @category Database
42  * @package  StatusNet
43  * @author   Evan Prodromou <evan@status.net>
44  * @license  http://www.fsf.org/licensing/licenses/agpl-3.0.html GNU Affero General Public License version 3.0
45  * @link     http://status.net/
46  */
47
48 class MysqlSchema extends Schema
49 {
50     static $_single = null;
51     protected $conn = null;
52
53
54     /**
55      * Main public entry point. Use this to get
56      * the singleton object.
57      *
58      * @return Schema the (single) Schema object
59      */
60
61     static function get()
62     {
63         if (empty(self::$_single)) {
64             self::$_single = new Schema();
65         }
66         return self::$_single;
67     }
68
69     /**
70      * Returns a TableDef object for the table
71      * in the schema with the given name.
72      *
73      * Throws an exception if the table is not found.
74      *
75      * @param string $table Name of the table to get
76      *
77      * @return TableDef tabledef for that table.
78      * @throws SchemaTableMissingException
79      */
80
81     public function getTableDef($table)
82     {
83         $def = array();
84         $hasKeys = false;
85
86         // Pull column data from INFORMATION_SCHEMA
87         $columns = $this->fetchMetaInfo($table, 'COLUMNS', 'ORDINAL_POSITION');
88         if (count($columns) == 0) {
89             throw new SchemaTableMissingException("No such table: $table");
90         }
91
92         foreach ($columns as $row) {
93
94             $name = $row['COLUMN_NAME'];
95             $field = array();
96
97             // warning -- 'unsigned' attr on numbers isn't given in DATA_TYPE and friends.
98             // It is stuck in on COLUMN_TYPE though (eg 'bigint(20) unsigned')
99             list($type, $size) = $this->reverseMapType($row['DATA_TYPE']);
100             $field['type'] = $type;
101             if ($size !== null) {
102                 $field['size'] = $size;
103             }
104
105             if ($type == 'char' || $type == 'varchar') {
106                 if ($row['CHARACTER_MAXIMUM_LENGTH'] !== null) {
107                     $field['length'] = intval($row['CHARACTER_MAXIMUM_LENGTH']);
108                 }
109             }
110             if ($type == 'numeric') {
111                 // Other int types may report these values, but they're irrelevant.
112                 // Just ignore them!
113                 if ($row['NUMERIC_PRECISION'] !== null) {
114                     $field['precision'] = intval($row['NUMERIC_PRECISION']);
115                 }
116                 if ($row['NUMERIC_SCALE'] !== null) {
117                     $field['scale'] = intval($row['NUMERIC_SCALE']);
118                 }
119             }
120             if ($row['IS_NULLABLE'] == 'NO') {
121                 $field['not null'] = true;
122             }
123             if ($row['COLUMN_DEFAULT'] !== null) {
124                 $field['default'] = $row['COLUMN_DEFAULT'];
125                 if ($this->isNumericType($type)) {
126                     $field['default'] = intval($field['default']);
127                 }
128             }
129             if ($row['COLUMN_KEY'] !== null) {
130                 // We'll need to look up key info...
131                 $hasKeys = true;
132             }
133             if ($row['COLUMN_COMMENT'] !== null && $row['COLUMN_COMMENT'] != '') {
134                 $field['description'] = $row['COLUMN_COMMENT'];
135             }
136
137             $extra = $row['EXTRA'];
138             if ($extra) {
139                 if (preg_match('/(^|\s)auto_increment(\s|$)/i', $extra)) {
140                     $field['type'] = 'serial';
141                 }
142                 // $row['EXTRA'] may contain 'on update CURRENT_TIMESTAMP'
143                 // ^ ...... how to specify?
144             }
145
146             if ($row['CHARACTER_SET_NAME'] !== null) {
147                 // @fixme check against defaults?
148                 //$def['charset'] = $row['CHARACTER_SET_NAME'];
149                 //$def['collate']  = $row['COLLATION_NAME'];
150             }
151
152             $def['fields'][$name] = $field;
153         }
154
155         if ($hasKeys) {
156             // INFORMATION_SCHEMA's CONSTRAINTS and KEY_COLUMN_USAGE tables give
157             // good info on primary and unique keys but don't list ANY info on
158             // multi-value keys, which is lame-o. Sigh.
159             //
160             // Let's go old school and use SHOW INDEX :D
161             //
162             $keyInfo = $this->fetchIndexInfo($table);
163             $keys = array();
164             foreach ($keyInfo as $row) {
165                 $name = $row['Key_name'];
166                 $column = $row['Column_name'];
167
168                 if (!isset($keys[$name])) {
169                     $keys[$name] = array();
170                 }
171                 $keys[$name][] = $column;
172
173                 if ($name == 'PRIMARY') {
174                     $type = 'primary key';
175                 } else if ($row['Non_unique'] == 0) {
176                     $type = 'unique keys';
177                 } else if ($row['Index_type'] == 'FULLTEXT') {
178                     $type = 'fulltext indexes';
179                 } else {
180                     $type = 'indexes';
181                 }
182                 $keyTypes[$name] = $type;
183             }
184
185             foreach ($keyTypes as $name => $type) {
186                 if ($type == 'primary key') {
187                     // there can be only one
188                     $def[$type] = $keys[$name];
189                 } else {
190                     $def[$type][$name] = $keys[$name];
191                 }
192             }
193         }
194         return $def;
195     }
196
197     /**
198      * Pull the given table properties from INFORMATION_SCHEMA.
199      * Most of the good stuff is MySQL extensions.
200      *
201      * @return array
202      * @throws Exception if table info can't be looked up
203      */
204
205     function getTableProperties($table, $props)
206     {
207         $data = $this->fetchMetaInfo($table, 'TABLES');
208         if ($data) {
209             return $data[0];
210         } else {
211             throw new SchemaTableMissingException("No such table: $table");
212         }
213     }
214
215     /**
216      * Pull some INFORMATION.SCHEMA data for the given table.
217      *
218      * @param string $table
219      * @return array of arrays
220      */
221     function fetchMetaInfo($table, $infoTable, $orderBy=null)
222     {
223         $query = "SELECT * FROM INFORMATION_SCHEMA.%s " .
224                  "WHERE TABLE_SCHEMA='%s' AND TABLE_NAME='%s'";
225         $schema = $this->conn->dsn['database'];
226         $sql = sprintf($query, $infoTable, $schema, $table);
227         if ($orderBy) {
228             $sql .= ' ORDER BY ' . $orderBy;
229         }
230         return $this->fetchQueryData($sql);
231     }
232
233     /**
234      * Pull 'SHOW INDEX' data for the given table.
235      *
236      * @param string $table
237      * @return array of arrays
238      */
239     function fetchIndexInfo($table)
240     {
241         $query = "SHOW INDEX FROM `%s`";
242         $sql = sprintf($query, $table);
243         return $this->fetchQueryData($sql);
244     }
245
246     /**
247      * Pull info from the query into a fun-fun array of dooooom
248      *
249      * @param string $sql
250      * @return array of arrays
251      */
252     protected function fetchQueryData($sql)
253     {
254         $res = $this->conn->query($sql);
255         if (PEAR::isError($res)) {
256             throw new Exception($res->getMessage());
257         }
258
259         $out = array();
260         $row = array();
261         while ($res->fetchInto($row, DB_FETCHMODE_ASSOC)) {
262             $out[] = $row;
263         }
264         $res->free();
265
266         return $out;
267     }
268
269     /**
270      * Creates a table with the given names and columns.
271      *
272      * @param string $name    Name of the table
273      * @param array  $columns Array of ColumnDef objects
274      *                        for new table.
275      *
276      * @return boolean success flag
277      */
278
279     public function createTable($name, $columns)
280     {
281         $uniques = array();
282         $primary = array();
283         $indices = array();
284
285         $sql = "CREATE TABLE $name (\n";
286
287         for ($i = 0; $i < count($columns); $i++) {
288
289             $cd =& $columns[$i];
290
291             if ($i > 0) {
292                 $sql .= ",\n";
293             }
294
295             $sql .= $this->_columnSql($cd);
296         }
297
298         $idx = $this->_indexList($columns);
299
300         if ($idx['primary']) {
301             $sql .= ",\nconstraint primary key (" . implode(',', $idx['primary']) . ")";
302         }
303
304         foreach ($idx['uniques'] as $u) {
305             $key = $this->_uniqueKey($name, $u);
306             $sql .= ",\nunique index $key ($u)";
307         }
308
309         foreach ($idx['indices'] as $i) {
310             $key = $this->_key($name, $i);
311             $sql .= ",\nindex $key ($i)";
312         }
313
314         $sql .= ") ENGINE=InnoDB CHARACTER SET utf8 COLLATE utf8_bin; ";
315
316         $res = $this->conn->query($sql);
317
318         if (PEAR::isError($res)) {
319             throw new Exception($res->getMessage());
320         }
321
322         return true;
323     }
324
325     /**
326      * Get the unique index key name for a given column on this table
327      */
328     function _uniqueKey($tableName, $columnName)
329     {
330         return $this->_key($tableName, $columnName);
331     }
332
333     /**
334      * Get the index key name for a given column on this table
335      */
336     function _key($tableName, $columnName)
337     {
338         return "{$tableName}_{$columnName}_idx";
339     }
340
341     /**
342      * Ensures that a table exists with the given
343      * name and the given column definitions.
344      *
345      * If the table does not yet exist, it will
346      * create the table. If it does exist, it will
347      * alter the table to match the column definitions.
348      *
349      * @param string $tableName name of the table
350      * @param array  $columns   array of ColumnDef
351      *                          objects for the table
352      *
353      * @return boolean success flag
354      */
355
356     public function ensureTable($tableName, $columns)
357     {
358         // XXX: DB engine portability -> toilet
359
360         try {
361             $td = $this->getTableDef($tableName);
362         } catch (SchemaTableMissingException $e) {
363             return $this->createTable($tableName, $columns);
364         }
365
366         $cur = $this->_names($td->columns);
367         $new = $this->_names($columns);
368
369         $dropIndex  = array();
370         $toadd      = array_diff($new, $cur);
371         $todrop     = array_diff($cur, $new);
372         $same       = array_intersect($new, $cur);
373         $tomod      = array();
374         $addIndex   = array();
375         $tableProps = array();
376
377         foreach ($same as $m) {
378             $curCol = $this->_byName($td->columns, $m);
379             $newCol = $this->_byName($columns, $m);
380
381             if (!$newCol->equals($curCol)) {
382                 $tomod[] = $newCol->name;
383                 continue;
384             }
385
386             // Earlier versions may have accidentally left tables at default
387             // charsets which might be latin1 or other freakish things.
388             if ($this->_isString($curCol)) {
389                 if ($curCol->charset != 'utf8') {
390                     $tomod[] = $newCol->name;
391                     continue;
392                 }
393             }
394         }
395
396         // Find any indices we have to change...
397         $curIdx = $this->_indexList($td->columns);
398         $newIdx = $this->_indexList($columns);
399
400         if ($curIdx['primary'] != $newIdx['primary']) {
401             if ($curIdx['primary']) {
402                 $dropIndex[] = 'drop primary key';
403             }
404             if ($newIdx['primary']) {
405                 $keys = implode(',', $newIdx['primary']);
406                 $addIndex[] = "add constraint primary key ($keys)";
407             }
408         }
409
410         $dropUnique = array_diff($curIdx['uniques'], $newIdx['uniques']);
411         $addUnique = array_diff($newIdx['uniques'], $curIdx['uniques']);
412         foreach ($dropUnique as $columnName) {
413             $dropIndex[] = 'drop key ' . $this->_uniqueKey($tableName, $columnName);
414         }
415         foreach ($addUnique as $columnName) {
416             $addIndex[] = 'add constraint unique key ' . $this->_uniqueKey($tableName, $columnName) . " ($columnName)";;
417         }
418
419         $dropMultiple = array_diff($curIdx['indices'], $newIdx['indices']);
420         $addMultiple = array_diff($newIdx['indices'], $curIdx['indices']);
421         foreach ($dropMultiple as $columnName) {
422             $dropIndex[] = 'drop key ' . $this->_key($tableName, $columnName);
423         }
424         foreach ($addMultiple as $columnName) {
425             $addIndex[] = 'add key ' . $this->_key($tableName, $columnName) . " ($columnName)";
426         }
427
428         // Check for table properties: make sure we're using a sane
429         // engine type and charset/collation.
430         // @fixme make the default engine configurable?
431         $oldProps = $this->getTableProperties($tableName, array('ENGINE', 'TABLE_COLLATION'));
432         if (strtolower($oldProps['ENGINE']) != 'innodb') {
433             $tableProps['ENGINE'] = 'InnoDB';
434         }
435         if (strtolower($oldProps['TABLE_COLLATION']) != 'utf8_bin') {
436             $tableProps['DEFAULT CHARSET'] = 'utf8';
437             $tableProps['COLLATE'] = 'utf8_bin';
438         }
439
440         if (count($dropIndex) + count($toadd) + count($todrop) + count($tomod) + count($addIndex) + count($tableProps) == 0) {
441             // nothing to do
442             return true;
443         }
444
445         // For efficiency, we want this all in one
446         // query, instead of using our methods.
447
448         $phrase = array();
449
450         foreach ($dropIndex as $indexSql) {
451             $phrase[] = $indexSql;
452         }
453
454         foreach ($toadd as $columnName) {
455             $cd = $this->_byName($columns, $columnName);
456
457             $phrase[] = 'ADD COLUMN ' . $this->_columnSql($cd);
458         }
459
460         foreach ($todrop as $columnName) {
461             $phrase[] = 'DROP COLUMN ' . $columnName;
462         }
463
464         foreach ($tomod as $columnName) {
465             $cd = $this->_byName($columns, $columnName);
466
467             $phrase[] = 'MODIFY COLUMN ' . $this->_columnSql($cd);
468         }
469
470         foreach ($addIndex as $indexSql) {
471             $phrase[] = $indexSql;
472         }
473
474         foreach ($tableProps as $key => $val) {
475             $phrase[] = "$key=$val";
476         }
477
478         $sql = 'ALTER TABLE ' . $tableName . ' ' . implode(', ', $phrase);
479
480         common_log(LOG_DEBUG, __METHOD__ . ': ' . $sql);
481         $res = $this->conn->query($sql);
482
483         if (PEAR::isError($res)) {
484             throw new Exception($res->getMessage());
485         }
486
487         return true;
488     }
489
490     /**
491      * Is this column a string type?
492      */
493     private function _isString(array $cd)
494     {
495         $strings = array('char', 'varchar', 'text');
496         return in_array(strtolower($cd['type']), $strings);
497     }
498
499     /**
500      * Return the proper SQL for creating or
501      * altering a column.
502      *
503      * Appropriate for use in CREATE TABLE or
504      * ALTER TABLE statements.
505      *
506      * @param ColumnDef $cd column to create
507      *
508      * @return string correct SQL for that column
509      */
510
511     function columnSql(array $cd)
512     {
513         $line = array();
514         $line[] = parent::_columnSql($cd);
515
516         if ($cd['type'] == 'serial') {
517             $line[] = 'auto_increment';
518         }
519
520         if (!empty($cd['extra'])) {
521             $line[] = $cd['extra']; // hisss boooo
522         }
523
524         if (!empty($cd['description'])) {
525             $line[] = 'comment';
526             $line[] = $this->quote($cd['description']);
527         }
528
529         return implode(' ', $line);
530     }
531
532     function mapType($column)
533     {
534         $map = array('serial' => 'int',
535                      'integer' => 'int',
536                      'numeric' => 'decimal');
537         
538         $type = $column['type'];
539         if (isset($map[$type])) {
540             $type = $map[$type];
541         }
542
543         if (!empty($column['size'])) {
544             $size = $column['size'];
545             if ($type == 'int' &&
546                        in_array($size, array('tiny', 'small', 'medium', 'big'))) {
547                 $type = $size . $type;
548             } else if (in_array($type, array('blob', 'text')) &&
549                        in_array($size, array('tiny', 'medium', 'long'))) {
550                 $type = $size . $type;
551             }
552         }
553
554         return $type;
555     }
556
557     /**
558      * Map a MySQL native type back to an independent type + size
559      *
560      * @param string $type
561      * @return array ($type, $size) -- $size may be null
562      */
563     protected function reverseMapType($type)
564     {
565         $type = strtolower($type);
566         $map = array(
567             'decimal' => array('numeric', null),
568             'tinyint' => array('int', 'tiny'),
569             'smallint' => array('int', 'small'),
570             'mediumint' => array('int', 'medium'),
571             'bigint' => array('int', 'big'),
572             'tinyblob' => array('blob', 'tiny'),
573             'mediumblob' => array('blob', 'medium'),
574             'longblob' => array('blob', 'long'),
575             'tinytext' => array('text', 'tiny'),
576             'mediumtext' => array('text', 'medium'),
577             'longtext' => array('text', 'long'),
578         );
579         if (isset($map[$type])) {
580             return $map[$type];
581         } else {
582             return array($type, null);
583         }
584     }
585
586     function typeAndSize($column)
587     {
588         if ($column['type'] == 'enum') {
589             $vals = array_map(array($this, 'quote'), $column['enum']);
590             return 'enum(' . implode(',', $vals) . ')';
591         } else if ($this->_isString($column)) {
592             return parent::typeAndSize($column) . ' CHARSET utf8';
593         } else {
594             return parent::typeAndSize($column);
595         }
596     }
597 }