Gene Ent638_2634 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_2634
Symbol
ID	5113802
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	+
Start bp	2833026
End bp	2834093
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	53%
IMG OID	640492823
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	YP_001177352
Protein GI	146312278
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.218349
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAGA AGACCCTCTT TATCGATCGT GACGGCACGA TCATTTCCGA GCCGCCCAGT 
GATTATCAGG TCGATCGTTT CGACAAACTG GCTTTTGAAG CGGATGTTAT CCCGGTTCTG 
CTTACGTTGC AGAAAGCCGG ATTTAAGCTG GTGATGATCA CCAATCAGGA CGGATTAGGC 
ACTGACAGTT TCCCGCAGGC GGATTTCGAC GGGCCGCATA ACCTGATGAT GCAGATCCTC 
TCCTCTCAGG GTGTGACGTT TGATGAGGTG CTGATTTGCC CGCACCTGCC AGCGGAGAAT 
TGCGATTGCC GCAAACCTAA AGTGAAGTTG GTTGAACGCT ATCTCGCTGA AGATGCGCTG 
GACCGTGCAA ACAGCTACGT GATTGGCGAC CGCGCAACGG ACATTGAGCT GGCCGATAAT 
ATGGGCATTC AAGGTCTGCG CTTTAACCGC TCCGAACTGA ACTGGGCGAT GATTGGCGAA 
AAGCTGACGA AACGCGATCG TTACTCGCAC GTCGAGCGCA ACACCAAAGA GACGCAAATC 
GACGTTAAGG TCTGGCTGGA TCGCGAAGGC GGCAGCAAGA TTCATACGGG TGTTGGGTTC 
TTTGACCATA TGCTGGATCA AATTTGCACG CACGGTGGTT TTCGTATGGA GATCAACGTG 
AAAGGCGATC TGTACATTGA CGATCACCAC ACCGTTGAAG ATACCGGCCT GGCACTGGGC 
GAAGCGTTGA AACTGGCGCT GGGTGATAAG CGCGGCATCA ACCGTTTCGG CTTTGTCCTG 
CCGATGGATG AGTGCCTGGC ACGCTGTGCG CTGGACATTT CTGGTCGCCC GCACCTGGAA 
TATAAAGCTG ATTTTACCTA TCAGCGCGTG GGCGATTTGA GCACTGAAAT GGTTGAACAC 
TTCTTCCGCT CCCTCTCCTA CACCATGGGC GTGACGTTGC ACCTGAAAAC AAAAGGCAAG 
AACGATCACC ACCGTGTCGA AAGCTTGTTC AAAGTCTTTG GCCGTACGCT GCGTCAGGCC 
ATTCGTGTCG ACGGCGATAC TCTGCCTTCG TCTAAAGGAG TGCTGTGA

Protein sequence

MSQKTLFIDR DGTIISEPPS DYQVDRFDKL AFEADVIPVL LTLQKAGFKL VMITNQDGLG 
TDSFPQADFD GPHNLMMQIL SSQGVTFDEV LICPHLPAEN CDCRKPKVKL VERYLAEDAL 
DRANSYVIGD RATDIELADN MGIQGLRFNR SELNWAMIGE KLTKRDRYSH VERNTKETQI 
DVKVWLDREG GSKIHTGVGF FDHMLDQICT HGGFRMEINV KGDLYIDDHH TVEDTGLALG 
EALKLALGDK RGINRFGFVL PMDECLARCA LDISGRPHLE YKADFTYQRV GDLSTEMVEH 
FFRSLSYTMG VTLHLKTKGK NDHHRVESLF KVFGRTLRQA IRVDGDTLPS SKGVL