PHPerKaigi 2025

La classe IntlBreakIterator

(PHP 5 >= 5.5.0, PHP 7, PHP 8)

Introduction

Un "délimiteur de rupture" est un objet ICU qui expose des méthodes pour localiser des délimitations dans du texte (par exemple, des délimitations de mots ou de phrases). La classe IntlBreakIterator de PHP sert de classe de base pour tous les types de délimiteurs de rupture ICU. Lorsqu'une fonctionnalité supplémentaire est disponible, l'extension intl peut exposer le délimiteur de rupture ICU avec des sous-classes appropriées, telles que IntlRuleBasedBreakIterator ou IntlCodePointBreakIterator.

Cette classe implémente IteratorAggregate. Parcourir un IntlBreakIterator produit des valeurs entières non négatives représentant les emplacements successifs des délimitations de texte, exprimées en tant que comptes d'unités de code UTF-8 (octets), pris depuis le début du texte (qui a l'emplacement 0). Les clés produites par l'itérateur forment simplement la séquence de nombres naturels {0, 1, 2, …}.

Synopsis de la classe

class IntlBreakIterator implements IteratorAggregate {
/* Constantes */
public const int DONE;
public const int WORD_NONE;
public const int WORD_NONE_LIMIT;
public const int WORD_NUMBER;
public const int WORD_NUMBER_LIMIT;
public const int WORD_LETTER;
public const int WORD_LETTER_LIMIT;
public const int WORD_KANA;
public const int WORD_KANA_LIMIT;
public const int WORD_IDEO;
public const int WORD_IDEO_LIMIT;
public const int LINE_SOFT;
public const int LINE_SOFT_LIMIT;
public const int LINE_HARD;
public const int LINE_HARD_LIMIT;
public const int SENTENCE_TERM;
public const int SENTENCE_TERM_LIMIT;
public const int SENTENCE_SEP;
public const int SENTENCE_SEP_LIMIT;
/* Méthodes */
private __construct()
public current(): int
public first(): int
public following(int $offset): int
public getErrorCode(): int
public getLocale(int $type): string|false
public getPartsIterator(string $type = IntlPartsIterator::KEY_SEQUENTIAL): IntlPartsIterator
public getText(): ?string
public isBoundary(int $offset): bool
public last(): int
public next(?int $offset = null): int
public preceding(int $offset): int
public previous(): int
public setText(string $text): bool
}

Historique

Version Description
8.4.0 Les constantes de classe sont désormais typées.
8.0.0 IntlBreakIterator implémente désormais IteratorAggregate. Avant, Traversable était implémentée à la place.

Sommaire

add a note

User Contributed Notes 1 note

up
9
SenseException
11 years ago
Since there is no excample for the usage of the IntlBreakIterator yet, I made a small one:

<?php

$text
= "Si contano i danni. Un morto a Roma, un treno ".
"deragliato e quattro feriti a Foggia, strade chiuse in tutto ".
"il sud, allagamenti e danni sulla costa ionica. A Pescara, ".
"1.500 sfollati per l'esondazione del Fosso Vallelunga. ".
"Dall'inizio dell'anno l'agricoltura ha subito un miliardo ".
"di euro di danni.";

$locale = 'it_IT';

$i = IntlBreakIterator::createSentenceInstance($locale);
$i->setText($text);

foreach(
$i->getPartsIterator() as $sentence) {
echo
$sentence . PHP_EOL . '----- next -----' . PHP_EOL;
}

?>

Result:

Si contano i danni.
----- next -----
Un morto a Roma, un treno deragliato e quattro feriti a Foggia, strade chiuse in tutto il sud, allagamenti e danni sulla costa ionica.
----- next -----
A Pescara, 1.500 sfollati per l'esondazione del Fosso Vallelunga.
----- next -----
Dall'inizio dell'anno l'agricoltura ha subito un miliardo di euro di danni.
----- next -----
To Top