Gene BURPS668_2003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_2003
Symbol
ID	4884272
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	+
Start bp	1982929
End bp	1983999
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	72%
IMG OID	640127931
Product	L-allo-threonine aldolase
Protein accession	YP_001059038
Protein GI	284159935
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATTGATT TCCTGAGCGA CACGGTGACG CTGCCGACCG CGGAGATGCG GCACGCGATG 
TTTACCGCGA ATGTGGGCGA CGATTGCTAC GGCGAGGATC CGACGGTCAA CGAGCTCGAA 
TCGGTGGCGG CCGGACTGAC CGGCAAGGAA GCGGCGGCGT TCGTCACGAG CGGCACGCTC 
GGCAACCTGA GCGCGCTGCT CGCGCAATGC CCGCGCGGGC ACGAGGTGAT CCTCGGCGAT 
CGCTCCGACC TGTACAACTA CGAGGCGGGC GGCGTGTCGC TCGTCGGCGG CGCGGTGTTG 
CACCCCGTCG AGACCGCCGA CGACGGCAGC CTGCCGCTCG AGCGGCTGCG CGCGGCGATC 
CGCGACAAGC GCGACCCCCA GTGCGCGCCC GCCGCGGTGA TCGCGCTCGA GAATCCGCAT 
TGCCTCGCCG GCGGCCGCGT GCTGTCGCTC GACTACCTGC GGCGCGTGCG CGCGCTCGCC 
GACGAGCACG GGCTCGCCGT GCACATGGAC GGCGCGCGTC TGTTCAACGC GCAGGCGAGC 
CTCGGCACGC CGGCGGCCGA GATCGTCGCG CACGTCGATT CGGTCCAGTT CTGCCTGTCG 
AAGAGCCTCG CCGCGCCGTA CGGCTCGATG GTGTGCGGCA GCGCCGCCCT GATCGATCGC 
GTGAAGCGCT ATCGGAAGCT GCTCGGCGGC GGCACGCGGC AAGCCGGCAT CATGGCGGCC 
GCCGGGCTCG TCGCGCTGCG CACGATGGTC GCGCGGCTCG CGGACGATCA CCGCCGCGCG 
GCGCGCCTCG CCGCGGAGCT GGCGCGGATT CCGGGCGTCG CGCTGCGCTC GGCGGTGATC 
GAGACGAACA TGGTGTTCTT CGACGTCGCC GAGCCGGGCA ACGAGGCGTT TCTCGCCGCG 
CTGCGCGACG CGGGCATCCG GATGGGCGTG CTCGGCGACG GCGTGATCCG GGCCGTCGTG 
CACTACATGA TCGACGACGA CGCGATCAGC CGCACCGTCG ACGCCGTCCG CGCGATTGTT 
CTTCCGTTCG CCCCGGCGTT AGCGCCGGCC GCCGCATCGC AGGCGCAATG A

Protein sequence

MIDFLSDTVT LPTAEMRHAM FTANVGDDCY GEDPTVNELE SVAAGLTGKE AAAFVTSGTL 
GNLSALLAQC PRGHEVILGD RSDLYNYEAG GVSLVGGAVL HPVETADDGS LPLERLRAAI 
RDKRDPQCAP AAVIALENPH CLAGGRVLSL DYLRRVRALA DEHGLAVHMD GARLFNAQAS 
LGTPAAEIVA HVDSVQFCLS KSLAAPYGSM VCGSAALIDR VKRYRKLLGG GTRQAGIMAA 
AGLVALRTMV ARLADDHRRA ARLAAELARI PGVALRSAVI ETNMVFFDVA EPGNEAFLAA 
LRDAGIRMGV LGDGVIRAVV HYMIDDDAIS RTVDAVRAIV LPFAPALAPA AASQAQ