Gene BURPS668_A2451 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_A2451
Symbol	leuB
ID	4887401
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009075
Strand	-
Start bp	2370223
End bp	2371290
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	68%
IMG OID	640132388
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_001063445
Protein GI	126443320
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.172832
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATTG CAGTGCTGCC CGGCGACGGC ATCGGTCCGG AAATCGTCAA TGAAGCGGTG 
AAGGTGCTGA ACGCGCTCGA CGAAAAGTTC GAACTGGAGC AGGCGCCGGT CGGCGGCGCC 
GGCTACGAGG CAAGCGGCCA TCCGTTGCCC GACGCGACGC TCGCGCTCGC GAAGGAAGCG 
GACGCGATCC TGTTCGGCGC GGTCGGCGAC TGGAAGTACG ATTCGCTCGA GCGCGCGCTG 
CGCCCCGAGC AGGCGATCCT CGGCCTGCGC AAGCATCTGG AGCTGTTCGC GAACTTCCGT 
CCGGCGATCT GCTATCCGCA GCTCGTCGAC GCTTCGCCGC TCAAGCCCGA GCTCGTCGCG 
GGCCTCGACA TCCTGATCGT GCGCGAACTG AACGGCGATA TCTACTTCGG CCAGCCGCGC 
GGCGTGCGCG CCGCGCCGGA CGGCCCGTTC GCGGGCGCGC GCGAAGGCTT CGACACGATG 
CGCTATTCGG AGCCGGAAGT GCGCCGCATC GCGCACGTCG CGTTCCAGGC CGCGCGAAAG 
CGCGCGAAGA AGCTGCTGTC GGTCGACAAA TCGAACGTGC TCGAGACGTC GCAGTTCTGG 
CGCGACGTGA TGATCGACGT GTCGAAGGAA TACGCGGACG TCGAGCTGTC GCACATGTAC 
GTCGACAACG CGGCGATGCA GCTCGCGAAG GCGCCGAAGC AGTTCGACGT GATCGTGACG 
GGCAACATGT TCGGCGACAT TTTGTCCGAC GAGGCGTCGA TGCTGACGGG CTCGATCGGC 
ATGCTGCCGT CCGCGTCGCT CGACCAGCGC AACAAGGGCC TGTACGAGCC GTCGCACGGC 
TCCGCGCCGG ACATCGCGGG CAAGGGCATC GCGAATCCGC TCGCGACGAT CCTGTCGGCC 
GCGATGCTGC TGCGCTACTC GCTGAACCGC GCGGAGCAGG CCGACCGCAT CGAGCGCGCG 
GTCAAGGCGG TGCTCGAGCA GGGCTACCGC ACGGGCGACA TCGCGACGCC GGGCTGCAAG 
CAGGTGGGCA CGGCCGCGAT GGGCGACGCG GTGGTCGCGG CGCTGTAA

Protein sequence

MKIAVLPGDG IGPEIVNEAV KVLNALDEKF ELEQAPVGGA GYEASGHPLP DATLALAKEA 
DAILFGAVGD WKYDSLERAL RPEQAILGLR KHLELFANFR PAICYPQLVD ASPLKPELVA 
GLDILIVREL NGDIYFGQPR GVRAAPDGPF AGAREGFDTM RYSEPEVRRI AHVAFQAARK 
RAKKLLSVDK SNVLETSQFW RDVMIDVSKE YADVELSHMY VDNAAMQLAK APKQFDVIVT 
GNMFGDILSD EASMLTGSIG MLPSASLDQR NKGLYEPSHG SAPDIAGKGI ANPLATILSA 
AMLLRYSLNR AEQADRIERA VKAVLEQGYR TGDIATPGCK QVGTAAMGDA VVAAL