python: Make invalid UTF-8 sequence messages consistent across Python versions.
authorBen Pfaff <blp@nicira.com>
Fri, 1 Jul 2011 17:11:30 +0000 (10:11 -0700)
committerBen Pfaff <blp@nicira.com>
Wed, 6 Jul 2011 16:00:51 +0000 (09:00 -0700)
commit070de9bd4137b78b1a74e287fea475ac7aa39bf6
tree1c13e7c40c729af0f60a1f0b3a471e4e2bec7fe1
parent391614125ff1adc3cc157124480a50008b8a7801
python: Make invalid UTF-8 sequence messages consistent across Python versions.

Given the invalid input <C0 22>, some versions of Python report <C0> as the
invalid sequence and other versions report <C0 22> as the invalid sequence.
Similarly, given input <ED 80 7F>, some report <ED 80> and others report
<ED 80 7F> as the invalid sequence.  This caused spurious test failures for
the test "no invalid UTF-8 sequences in strings - Python", so this commit
makes the messages consistent by dropping the extra trailing byte from the
message.

I first noticed the longer sequences <C0 22> and <ED 80 7F> on Ubuntu
10.04 with python version 2.6.5-0ubuntu1, but undoubtedly it exists
elsewhere also.
python/ovs/json.py