Gene BURPS668_3681 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3681
Symbol	thiO
ID	4882133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3601162
End bp	3602295
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	73%
IMG OID	640129609
Product	glycine oxidase ThiO
Protein accession	YP_001060685
Protein GI	126438668
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0665] Glycine/D-amino acid oxidases (deaminating)
TIGRFAM ID	[TIGR02352] glycine oxidase ThiO

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACATGC GTGCGTCTGA ACCCGATTTC GCGGTGCTGG GCGGCGGCCT CGTCGGCCGC 
CTGATCGCGT GGCGCCTCGC GGGCGCGGGA TACCGCGTGT CGCTCTACGA GCGCGGCGAC 
GCGGCGGGCT CGGGCTCGGC CGCATGGGTC GCGGCCGCGA TGCTCGCGCC GCTCGCCGAA 
GCCGCGAGCG CCGAGCGCCT CATCACCGAT CTCGGCGTCG CGTCGTTCGA TCTGTGGCCG 
AGCTGGCTTG CCGAGCTGCC GGAGCCCGTC TACTTCCAGC GCAACGGCAC GCTTGTCGTC 
TGGCATCACG CGGACCGCGC GGAAGCGCCG CTCTTCGAGC GCCGCGTGCG CGCGAACGCG 
AGCGCCGAGC TGCTCGACGG CGGCCTCATC GCGCTCGCGG GCGCGCAGCT CGACGCGGCC 
GAGCCGGCGC TCGCCGGCCG CTTCGCGCGC GGCCTGCTGC TGCCGCGCGA AGGCCAGCTC 
GACAATCGCC AGGCGCTGCG CGCGCTCGCC GCGGGCTTGG CCGAGCGCGG TGTCGACGTG 
CACTGGAATG CCGCCGTCGC GCCCGACGCC GCGCCCGCCG CGCGCATCAC GATCGACTGC 
CGCGGGCTCG GCGCGAAGGC GCAGATGCCG GCGCTGCGCG GGATTCGCGG CGAAGTCGCG 
CGCGTGCACG CGCCCGGCAT CGGCCTCACG CGCCCCGTGC GACTCTTGCA TCCGCGCTAT 
CCGCTGTACG TCGCACCGAA GGAGAACGAT CTCTACGTGA TCGGCGCGAC CGAGATCGAG 
GGCGAGGACA TGTCGCCCGT CAGCGTGCGC TCCGCGCTCG AATTGCTGAG CGCCGCGTTC 
TCCGTGCACC CGGCGTTCGG CGAGGCGCGT ATTCTTGAAC TGAACACGCA ATGCCGGCCG 
ACGCTGCCCG ACCATCGTCC GGCGCTCGTG TGGGACGGCG GCGCGACGCT CGCGGTCAAC 
GGCCTGTACC GGCACGGTTT CATGATCGCG CCGGAAATCG CCGATGCCGC GGCCCGTTTC 
GCGCAGGCGC TCGTCGAGCA TACCGTGAAG GATGCCGATA CGTTCGCCGC GTGGCGGCGC 
GACGCGCGCT GGCCGGCGCT GCTGCAGCAG CGCGCGGCGC ACGCATCCGC GTGA

Protein sequence

MNMRASEPDF AVLGGGLVGR LIAWRLAGAG YRVSLYERGD AAGSGSAAWV AAAMLAPLAE 
AASAERLITD LGVASFDLWP SWLAELPEPV YFQRNGTLVV WHHADRAEAP LFERRVRANA 
SAELLDGGLI ALAGAQLDAA EPALAGRFAR GLLLPREGQL DNRQALRALA AGLAERGVDV 
HWNAAVAPDA APAARITIDC RGLGAKAQMP ALRGIRGEVA RVHAPGIGLT RPVRLLHPRY 
PLYVAPKEND LYVIGATEIE GEDMSPVSVR SALELLSAAF SVHPAFGEAR ILELNTQCRP 
TLPDHRPALV WDGGATLAVN GLYRHGFMIA PEIADAAARF AQALVEHTVK DADTFAAWRR 
DARWPALLQQ RAAHASA