Gene EcE24377A_2313 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2313
Symbol	hisB
ID	5586479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	2276131
End bp	2277198
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	54%
IMG OID	640925978
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	YP_001463373
Protein GI	157155752
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAGA AGTATCTTTT TATCGATCGC GATGGAACCC TGATTAGCGA ACCGCCGAGT 
GATTTTCAGG TGGACCGTTT TGACAAACTC GCCTTTGAAC CGGGCGTGAT CCCGGAACTG 
CTGAAGCTGC AAAAAGCGGG CTACAAGCTG GTGATGATCA CTAATCAGGA TGGTCTGGGA 
ACACAAAGTT TCCCGCAGGC GGATTTTGAT GGCCCGCACA ACCTGATGAT GCAGATCTTC 
ACCTCGCAAG GCGTGCAGTT TGATGAAGTG CTGATTTGTC CGCACCTGCC CGCCGATGAG 
TGCGACTGCC GTAAGCCGAA AGTAAAACTG GTAGAGCGTT ATCTGGCTGA GCAAGCGATG 
GATCGTGCCA ACAGTTATGT GATTGGCGAT CGCGCGACCG ACATTCAACT GGCGGAAAAC 
ATGGGTATTA ATGGTTTACG CTACGACCGC GAAATCCTGA GCTGGCCGAT GATTGGCGAG 
CAACTCACTA AACGAGACCG TTACGCCCAT GTAGTGCGCA ACACCAAAGA GACGCAAATT 
GACGTCCAGG TGTGGCTGGA TCGCGAAGGT GGCAGCAAGA TTAATACCGG CGTTGGCTTC 
TTTGATCACA TGCTGGATCA GATCGCCACC CACGGCGGTT TCCGTATGGA AATCAACGTC 
AAAGGCGACC TCTATATCGA CGATCACCAC ACCGTCGAAG ATACCGGCCT GGCGCTGGGC 
GAAGCGCTAA AAATCGCCCT TGGCGACAAA CGCGGTATTT GCCGCTTTGG TTTTGTGCTA 
CCGATGGACG AATGCCTTGC CCGCTGCGCG CTGGATATCT CTGGTCGCCC GCACCTGGAA 
TATAAAGCCG AGTTTACCTA CCAGCGCGTG GGCGATCTCA GCACCGAAAT GATCGAGCAC 
TTCTTCCGTT CGCTCTCATA CACCATGGGC GTGACGCTAC ACCTGAAAAC CAAAGGTAAA 
AACGATCACC ACCGTGTAGA GAGCCTGTTC AAAGCCTTTG GTCGCACCCT GCGCCAGGCC 
ATCCGCGTGG AAGGCGACAC CCTGCCCTCG TCGAAAGGAG TGCTGTAA

Protein sequence

MSQKYLFIDR DGTLISEPPS DFQVDRFDKL AFEPGVIPEL LKLQKAGYKL VMITNQDGLG 
TQSFPQADFD GPHNLMMQIF TSQGVQFDEV LICPHLPADE CDCRKPKVKL VERYLAEQAM 
DRANSYVIGD RATDIQLAEN MGINGLRYDR EILSWPMIGE QLTKRDRYAH VVRNTKETQI 
DVQVWLDREG GSKINTGVGF FDHMLDQIAT HGGFRMEINV KGDLYIDDHH TVEDTGLALG 
EALKIALGDK RGICRFGFVL PMDECLARCA LDISGRPHLE YKAEFTYQRV GDLSTEMIEH 
FFRSLSYTMG VTLHLKTKGK NDHHRVESLF KAFGRTLRQA IRVEGDTLPS SKGVL