Gene BURPS1106A_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS1106A_2023
Symbol
ID	4901860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 1106a
Kingdom	Bacteria
Replicon accession	NC_009076
Strand	+
Start bp	1988294
End bp	1989454
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	71%
IMG OID	640135253
Product	L-allo-threonine aldolase
Protein accession	YP_001066288
Protein GI	126454958
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2008] Threonine aldolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.181196
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACGCA CGACGGCGGC CGCGAAGGCG GCCGTCTCGA CGACGAACCG GCGCAGCGAG 
GCCGGACGAC CCAACCAATG GATCGATGCG ATGATTGATT TCCTGAGCGA CACGGTGACG 
CTGCCGACCG CGGAGATGCG GCACGCGATG TTTACCGCGA ATGTGGGCGA CGATTGCTAT 
GGCGAGGATC CGACGGTCAA CGAGCTCGAA TCGGTGGCGG CCGGACTGAC CGGCAAGGAA 
GCGGCGGCGT TCGTCACGAG CGGCACGCTC GGCAACCTGA GCGCGCTGCT CGCGCAATGC 
CCGCGCGGGC ACGAGGTGAT CCTCGGCGAT CGCTCCGACC TGTACAACTA CGAGGCGGGC 
GGCGTGTCGC TCGTCGGCGG CGCGGTGTTG CACCCCGTCG AGACCGCCGA CGACGGCAGC 
CTGCCGCTCG AGCGGCTGCG CGCGGCGATC CGCGACAAGC GCGACCCCCA GTGCGCGCCC 
GCCGCGGTGA TCGCGCTCGA GAATCCGCAT TGCCTCGCCG GCGGCCGCGT GCTGTCGCTC 
GACTACCTGC GGCGCGTGCG CGCGCTCGCC GACGAGCACG GGCTCGCCGT GCACATGGAC 
GGCGCGCGTC TGTTCAACGC GCAGGCGAGC CTCGGCACGC CGGCGGCCGA GATCGTCGCG 
CACGTCGATT CGGTCCAGTT CTGCCTGTCG AAGAGCCTCG CCGCGCCGTA CGGCTCGATG 
GTGTGCGGCA GCGCCGCCCT GATCGATCGC GTGAAGCGCT ATCGGAAGCT GCTCGGCGGC 
GGCACGCGGC AAGCCGGCAT CATGGCGGCC GCCGGGCTCG TCGCGCTGCG CACGATGGTC 
GCGCGGCTCG CGGACGATCA CCGCCGCGCG GCGCGCCTCG CCGCGGAGCT GGCGCGGATT 
CCGGGCGTCG CGCTGCGCTC GGCGGTGATC GAGACGAACA TGGTGTTCTT CGACGTCGCC 
GAGCCGGGCA ACGAGGCGTT TCTCGCCGCG CTGCGCGACG CGGGCATCCG GATGGGCGTG 
CTCGGCGACG GCGTGATCCG GGCCGTCGTG CACTACATGA TCGACGACGA CGCGATCAGC 
CGCACCGTCG ACGCCGTCCG CGCGATTGTT CTTCCGTTCG CCCCGGCGTT AGCGCCGGCC 
GCCGCATCGC AGGCGCAATG A

Protein sequence

MTRTTAAAKA AVSTTNRRSE AGRPNQWIDA MIDFLSDTVT LPTAEMRHAM FTANVGDDCY 
GEDPTVNELE SVAAGLTGKE AAAFVTSGTL GNLSALLAQC PRGHEVILGD RSDLYNYEAG 
GVSLVGGAVL HPVETADDGS LPLERLRAAI RDKRDPQCAP AAVIALENPH CLAGGRVLSL 
DYLRRVRALA DEHGLAVHMD GARLFNAQAS LGTPAAEIVA HVDSVQFCLS KSLAAPYGSM 
VCGSAALIDR VKRYRKLLGG GTRQAGIMAA AGLVALRTMV ARLADDHRRA ARLAAELARI 
PGVALRSAVI ETNMVFFDVA EPGNEAFLAA LRDAGIRMGV LGDGVIRAVV HYMIDDDAIS 
RTVDAVRAIV LPFAPALAPA AASQAQ