Gene BURPS668_3666 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BURPS668_3666
Symbol	hisD
ID	4883162
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Burkholderia pseudomallei 668
Kingdom	Bacteria
Replicon accession	NC_009074
Strand	-
Start bp	3588970
End bp	3590307
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	70%
IMG OID	640129594
Product	histidinol dehydrogenase
Protein accession	YP_001060670
Protein GI	126439234
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTATCA AGATACGCAA ACTCGATTCG GCAGGCGAAG GCTTCGCGGC CGAATTGCGC 
GCGGTGCTCG CGTTCGAGGC GAGCGAAGAC GACGCGATCG AGCGCGCGGT CGCGCAGATT 
CTCGCCGACG TGAAGGCGCG CGGCGACGCC GCGGTGCTCG ACTACACGAA TCGCTTCGAC 
CGGCTGAACG CGGCGAGCGT CGCGGCGCTC GAGCTGCCGC AAAGCGAGCT GGAAGCGGCG 
CTCGAGGGCC TCGAGCCGAA GCGCCGCGCG GCGCTCGAAG CGGCGGCCGC GCGCGTGCGC 
GGCTACCACG AGAAGCAGAA GATCGAGTGC GGCAGCCATA GCTGGCAGTA CACCGAGGCC 
GACGGCACCG TGCTCGGCCA GAAGGTGACG CCGCTCGACC GCGTCGGCCT GTACGTGCCG 
GGCGGCAAGG CCGCGTATCC GTCGTCGGTG CTGATGAACG CGATTCCGGC GCGCGTCGCG 
GGCGTCGGCG AGATCGTGAT GGTCGTGCCG ACGCCGGACG GCCTGAAGAA CGATCTCGTG 
CTCGCCGCGG CGCTGTTGGG CGGCGTCGAT CGCGTGTTCA CGATCGGCGG CGCGCAGGCG 
GTGGCCGCGC TCGCGTACGG CACGCAGACG GTGCCCGCCG TCGACAAGAT CTGCGGGCCG 
GGCAACGCGT ACGTCGCGTC GGCCAAGCGC CGCGTGTTCG GCACGGTCGG CATCGACATG 
ATCGCCGGGC CGTCGGAGAT CCTCGTGCTG TGCGACGGCA CGACCGATCC GTCGTGGGTC 
GCGATGGACC TGTTCTCGCA GGCCGAGCAC GACGAGCTCG CGCAATCGAT CCTGCTGTGC 
CCGGACGAAA CGTTCATCGA GCGCGTCGAG AAGGCGATCG GCGAGCTGCT GCCGACGATG 
CCGCGCCAGG ACGTGATCCG CGCGTCGCTC GAGGGGCGCG GCGCGCTCGT CAAGGTGCGC 
GACATGGCCG AGGCGTGCAG GATCGCGAAC GACATCGCGC CCGAGCACCT GGAGATCTCC 
GCGCTCGAGC CGCACCAATG GGGCAAGCAG ATCCGCCACG CGGGCGCGAT CTTCCTCGGC 
CGCTACACGA GCGAGAGCCT GGGCGATTAC TGCGCGGGCC CGAATCACGT GCTGCCGACG 
TCGCGCACCG CGCGCTTTTC GTCGCCGCTC GGCGTGTACG ATTTCTTCAA GCGCTCGAGC 
CTGATCGAGG TGAGCGCCGA AGGCGCGCAC ACGCTCGGCG AGATCGCGTC CGAGCTCGCG 
TACGGCGAAG GTTTGCAGGC GCACGCGAAG AGCGCCGAGT ACCGGATGAA AGGAGCGGGC 
GACCGCCAGA AAGGCTAA

Protein sequence

MAIKIRKLDS AGEGFAAELR AVLAFEASED DAIERAVAQI LADVKARGDA AVLDYTNRFD 
RLNAASVAAL ELPQSELEAA LEGLEPKRRA ALEAAAARVR GYHEKQKIEC GSHSWQYTEA 
DGTVLGQKVT PLDRVGLYVP GGKAAYPSSV LMNAIPARVA GVGEIVMVVP TPDGLKNDLV 
LAAALLGGVD RVFTIGGAQA VAALAYGTQT VPAVDKICGP GNAYVASAKR RVFGTVGIDM 
IAGPSEILVL CDGTTDPSWV AMDLFSQAEH DELAQSILLC PDETFIERVE KAIGELLPTM 
PRQDVIRASL EGRGALVKVR DMAEACRIAN DIAPEHLEIS ALEPHQWGKQ IRHAGAIFLG 
RYTSESLGDY CAGPNHVLPT SRTARFSSPL GVYDFFKRSS LIEVSAEGAH TLGEIASELA 
YGEGLQAHAK SAEYRMKGAG DRQKG