Changeset 08444c0 in osmose-backend


Ignore:
Timestamp:
May 5, 2014 8:57:16 PM (6 years ago)
Author:
Jocelyn Jaubert <jocelyn.jaubert@…>
Branches:
master
Children:
8006308
Parents:
cb9a721 (diff), c8909eb (diff)
Note: this is a merge changeset, the changes displayed below correspond to the merge itself.
Use the (diff) links above to see all the changes relative to each parent.
Message:

Merge branch 'Name_Dictionary'

Files:
2 edited

Legend:

Unmodified
Added
Removed
  • modules/config.py

    rc16819f rc64755f  
    2525username = pwd.getpwuid(os.getuid())[0] 
    2626 
     27 
    2728# path to where osmose is installed 
    28 dir_osmose = "/data/project/osmose/backend" 
     29dir_osmose = os.path.dirname(os.path.dirname(os.path.abspath(__file__))) 
    2930 
    3031# path to a temporary space, that doesn't need to be backup 
  • plugins/Name_Dictionary.py

    r83180247 rc8909eb  
    126126        # Dictionnaire d'encodage 
    127127        self.DicoEncodage = {} 
    128         self.DicoEncodage[u"à"] = u"à" 
    129         self.DicoEncodage[u"é"] = u"é" 
    130         self.DicoEncodage[u"Ú"] = u"è" 
    131         self.DicoEncodage[u"ë"] = u"ë" 
    132         self.DicoEncodage[u"ê"] = u"ê" 
    133         self.DicoEncodage[u"î"] = u"î" 
    134         self.DicoEncodage[u"ï"] = u"ï" 
    135         self.DicoEncodage[u"ÃŽ"] = u"ô" 
    136         self.DicoEncodage[u"ö"] = u"ö" 
    137         self.DicoEncodage[u"û"] = u"û" 
    138         self.DicoEncodage[u"ÃŒ"] = u"ü" 
    139         self.DicoEncodage[u"ÿ"] = u"ÿ" 
    140         self.DicoEncodage[u"ç"] = u"ç" 
    141         self.DicoEncodage[u"Ã�"] = u"À" 
    142         self.DicoEncodage[u"É"] = u"É" 
    143         self.DicoEncodage[u"Ã�"] = u"É" 
    144         self.DicoEncodage[u"Ã�"] = u"È" 
    145         self.DicoEncodage[u"Ã�"] = u"Ë" 
    146         self.DicoEncodage[u"Ã�"] = u"Ê" 
    147         self.DicoEncodage[u"Ã�"] = u"Î" 
    148         self.DicoEncodage[u"Ã�"] = u"Ï" 
    149         self.DicoEncodage[u"Ã�"] = u"Ô" 
    150         self.DicoEncodage[u"Ã�"] = u"Ö" 
    151         self.DicoEncodage[u"Ã�"] = u"Û" 
    152         self.DicoEncodage[u"Ã�"] = u"Ü" 
    153         self.DicoEncodage[u"Åž"] = u"Ÿ" 
    154         self.DicoEncodage[u"Ã�"] = u"Ç" 
    155         self.DicoEncodage[u"Å�"] = u"œ" 
    156         self.DicoEncodage[u"Ê"] = u"æ" 
    157         self.DicoEncodage[u"Å�"] = u"Œ" 
    158         self.DicoEncodage[u"Ã�"] = u"Æ" 
     128        for c in (u"à", u"é", u"è", u"ë", u"ê", u"î", u"ï", u"ô", u"ö", u"û", u"ü", u"ÿ", u"ç", u"À", u"É", u"É", u"È", u"Ë", u"Ê", u"Î", u"Ï", u"Ô", u"Ö", u"Û", u"Ü", u"Ÿ", u"Ç", u"œ", u"æ", u"Œ", u"Æ"): 
     129            ustr = "".join([unichr(int(i.encode('hex'), 16)) for i in c.encode('utf-8')]) 
     130            self.DicoEncodage[ustr] = c 
    159131 
    160132        self.DicoEncodage[u"s‎"]  = u"s" 
    161         self.DicoEncodage[u"�"]  = u"é" 
    162         self.DicoEncodage[u"ᵉ"]  = u"ème - caratère absent de beaucoup de polices" 
    163         self.DicoEncodage[u"�"]  = u"è" 
    164133        self.DicoEncodage[u"`"]  = u"'" 
    165         self.DicoEncodage[u"�"]  = u"ê" 
    166134        self.DicoEncodage[u"n‎"]  = u"n" 
    167135 
     
    190158                    if x in WordComplet: 
    191159                        PbEncodage = True 
    192                         err.append((704, 0, {"fix": {"name": self.DicoEncodage[x]} })) 
     160                        err.append((704, 0, {"fix": {"name": initialName.replace(x, self.DicoEncodage[x])} })) 
    193161                if PbEncodage: continue 
    194162                #if WordComplet in self.DictMotsInconnus: continue 
     
    229197    #    f.close() 
    230198    #    return 
     199 
     200########################################################################### 
     201from plugins.Plugin import TestPluginCommon 
     202 
     203class Test(TestPluginCommon): 
     204    def test(self): 
     205        import modules.config as config 
     206        from analysers.analyser_sax import Analyser_Sax 
     207        class _config: 
     208            options = {"language": "fr"} 
     209            dir_scripts = config.dir_osmose 
     210        class father(Analyser_Sax): 
     211            config = _config() 
     212            def __init__(self): 
     213                pass 
     214        a = Name_Dictionary(father()) 
     215        a.init(None) 
     216        name = [(u"Pont des Anes", u"Pont des Ânes"), 
     217                (u"Pont des Ânes", None), 
     218                (u"Rue Saint-André", u"Rue Saint-André"), 
     219                (u"Rue Saint-André", None), 
     220                (u"Rue de l`Acadie", u"Rue de l'Acadie"), 
     221                (u"200ième rue", None), 
     222                (u"199ème avenue", None), 
     223                (u"199ème Avenude", u"199ème Avenue"), 
     224                (u"199ème Avenue", None), 
     225                (u"\u00c3\u0087a", u"Ça"), 
     226                (u"Ça", None), 
     227               ] 
     228        for (n, f) in name: 
     229            rdp = a.node(None, {"name": n}) 
     230            if f: 
     231                self.check_err(rdp, ("name='%s'" % n)) 
     232                fix = rdp[0][2]["fix"]["name"] 
     233                print u'\u2713'.encode('utf-8') 
     234                print fix.encode('utf-8') 
     235                self.assertEquals(fix, f, u"name='%s' - fix = wanted='%s' / got='%s'" % (n, f, fix)) 
     236            else: 
     237                assert not rdp, ("name='%s'" % n) 
Note: See TracChangeset for help on using the changeset viewer.