Gene BURPS1106A_1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_1042
Symbol	cobD
ID	4902263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	-
Start bp	1018107
End bp	1019159
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	76%
IMG OID	640134272
Product	putative threonine-phosphate decarboxylase
Protein accession	YP_001065322
Protein GI	126454618
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0079] Histidinol-phosphate/aromatic aminotransferase and cobyric acid decarboxylase
TIGRFAM ID	[TIGR01140] L-threonine-O-3-phosphate decarboxylase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0057725
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGACG CGCCGATCAC GCACGGCGGC AACCTGCACG AAGCCGCCCT TCGCTACGGC 
ATCCCGCGCG ACGCGTGGCT CGATCTGTCG ACGGGCATCA ATCCGCACGG TTTTCCGGTG 
CCGCCCGTGC CCGCCGACGC GTGGCGCCGG CTGCCCGAGG ACGACGGCGT GCTCGCCGCG 
CACGCGGCGC GCTACTACCG CGCGCCGGGC GCGGCGCACG TGCTGCCCGT CGCGGGCAGC 
CAGGCGGCGA TCCGTGCGCT GCCGGCGCTT TTCGCGCGCG GCACGGTCGG CGTCGCGCCG 
CTCGCATACA GCGAGTACGC GCCCGCGTTC GCGCGCCACG GCCATTCGGG CGCGCCGCTC 
GACTGCGGCG CCGACACGCT GCCCGCCGCG CTCACGTACG CGATCGTCGC CAATCCGAAC 
AATCCGACCG CCGAACGCAT CGATCGCACG CGGCTGCTGC GCTGGCACGC GCAACTCGTC 
GCGCGCGGCG GCGCGCTGAT CGTCGACGAG GCGTTCGCGG ACGCCGAGAG CGCCGCGCAC 
GCGTCGCTCG CCGCGGACAC GCATCGCGAC GGCCTCGTCG TATTGCGCTC GGTCGGCAAG 
TTCTTCGGCC TCGCGGGCGT GCGCGCGGGC TTCGCGCTCG CCGCGCCCGC GCTGCTCGCG 
CGGCTGCGCG ACGCGCTCGG CGCGTGGACC GTCAGCGGCC CGGCGCGCCA CGCGGTGCTC 
GCCGCGTTCG CGGACGCGGC GTGGCAGCAC GCGATGCGCG AGCGGCTCGC GCACGACGGC 
GCGCGCCTTG CCGCGCTGCT GCGCGCGCAC GGCTTCGTCA CGCACGCGAC GCCGCTTTTC 
AGCTGGAGCG CCGATCCGCG CGCGCACGCG CTGCACGACG CGCTCGCGGC GCGCGGAATC 
TGGACGCGCT ACTTCGCGCA CGCGCCGAGC GTGCGCATCG GGCTGCCCGC CGGCGACGAC 
GACTGGCGGC GGCTCGAACG CACGCTCGCC GAGTGCGTGC CGACGCTAGC GGCCGCAGCC 
GCGCATCCTT CCGAATCGAC CACACGGGAT TGA

Protein sequence

MADAPITHGG NLHEAALRYG IPRDAWLDLS TGINPHGFPV PPVPADAWRR LPEDDGVLAA 
HAARYYRAPG AAHVLPVAGS QAAIRALPAL FARGTVGVAP LAYSEYAPAF ARHGHSGAPL 
DCGADTLPAA LTYAIVANPN NPTAERIDRT RLLRWHAQLV ARGGALIVDE AFADAESAAH 
ASLAADTHRD GLVVLRSVGK FFGLAGVRAG FALAAPALLA RLRDALGAWT VSGPARHAVL 
AAFADAAWQH AMRERLAHDG ARLAALLRAH GFVTHATPLF SWSADPRAHA LHDALAARGI 
WTRYFAHAPS VRIGLPAGDD DWRRLERTLA ECVPTLAAAA AHPSESTTRD