Gene BURPS1106A_3739 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_3739
Symbol	thiO
ID	4899551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	3648379
End bp	3649512
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	74%
IMG OID	640136965
Product	glycine oxidase ThiO
Protein accession	YP_001067969
Protein GI	126451980
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATGC GTGCGTCTGA ACCCGATTTC GCGGTGCTGG GCGGCGGCCT CGTCGGCCGC 
CTGATCGCGT GGCGCCTCGC GGGCGCGGGA TACCGCGTGT CGCTCTACGA GCGCGGCGAC 
GCGGCGGGCT CGGGCTCGGC CGCATGGGTC GCGGCCGCGA TGCTCGCGCC GCTCGCCGAA 
GCCGCGAGCG CCGAGCGCCT CATCACCGAT CTCGGCGTCG CGTCGTTCGA TCTGTGGCCG 
AGCTGGCTTG CCGAGCTGCC GGAGCCCGTC TACTTCCAGC GCAACGGCAC GCTTGTCGTC 
TGGCATCACG CGGACCGCGC GGAAGCGCCG CTCTTCGAGC GCCGCGTGCG CGCGAACGCG 
AGCGCCGAGC TGCTCGACGG CGGCCTCATC GCGCTCGCGG GCGCGCAGCT CGACGCGGCC 
GAGCCGGCGC TCGCCGGCCG CTTCGCGCGC GGCCTGCTGC TGCCGCGCGA AGGCCAGCTC 
GACAATCGCC AGGCGCTGCG CGCGCTCGCC GCGGGCTTGG CCGAGCGCGG TGTCGACGTG 
CACTGGAATG CCGCCGTCGC GCCCGATGCC GCGCCCGCCG CGCGCATCAC GATCGACTGC 
CGCGGGCTCG GCGCGAAGGC GCAGATGCCG GCGCTGCGCG GGATTCGCGG CGAAGTCGCG 
CGCGTGCACG CGCCCGGCAT CGGCCTCACG CGCCCCGTGC GACTCTTGCA TCCGCGCTAT 
CCGCTGTACG TCGCGCCGAA GGAGAACGAT CTCTACGTGA TCGGCGCGAC CGAGATCGAG 
GGCGAGGACA TGTCGCCCGT CAGCGTGCGC TCCGCGCTCG AATTGCTGAG CGCCGCGTTC 
TCCGTGCACC CGGCGTTCGG CGAGGCGCGT ATTCTTGAAC TGAACACGCA ATGCCGGCCG 
ACGCTGCCCG ACCATCGTCC GGCGCTCGTG TGGGACGGCG GCGCGACGCT CGCGGTCAAC 
GGCCTGTACC GGCACGGCTT CATGATCGCG CCGGAAATCG CCGATGCCGC GGCCCGTTTC 
GCGCAGGCGC TCGTCGAGCG TACCGTGAAG GATGCCGATA CGTTCGCCGC GTGGCGGCGC 
GACGCGCGCT GGCCGGCGCT GCTGCAGCAG CGCGCGGCGC ACGCGTCCGC GTGA

Protein sequence

MNMRASEPDF AVLGGGLVGR LIAWRLAGAG YRVSLYERGD AAGSGSAAWV AAAMLAPLAE 
AASAERLITD LGVASFDLWP SWLAELPEPV YFQRNGTLVV WHHADRAEAP LFERRVRANA 
SAELLDGGLI ALAGAQLDAA EPALAGRFAR GLLLPREGQL DNRQALRALA AGLAERGVDV 
HWNAAVAPDA APAARITIDC RGLGAKAQMP ALRGIRGEVA RVHAPGIGLT RPVRLLHPRY 
PLYVAPKEND LYVIGATEIE GEDMSPVSVR SALELLSAAF SVHPAFGEAR ILELNTQCRP 
TLPDHRPALV WDGGATLAVN GLYRHGFMIA PEIADAAARF AQALVERTVK DADTFAAWRR 
DARWPALLQQ RAAHASA