Gene EcolC_1620 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1620
Symbol
ID	6066075
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1800839
End bp	1801906
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	54%
IMG OID	641601035
Product	imidazole glycerol-phosphate dehydratase/histidinol phosphatase
Protein accession	YP_001724605
Protein GI	170019651
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0131] Imidazoleglycerol-phosphate dehydratase [COG0241] Histidinol phosphatase and related phosphatases
TIGRFAM ID	[TIGR01261] histidinol-phosphatase [TIGR01656] histidinol-phosphate phosphatase family domain [TIGR01662] HAD-superfamily hydrolase, subfamily IIIA

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.522162
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.800439
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAGA AGTATCTTTT TATCGATCGC GATGGAACCC TGATTAGCGA ACCGCCGAGT 
GATTTTCAGG TGGACCGTTT TGACAAACTC GCCTTTGAAC CGGGCGTGAT CCCGGAGCTG 
CTAAAGCTGC AAAAAGCGGG CTACAAGCTG GTGATGATCA CTAATCAGGA TGGTCTTGGA 
ACACAAAGTT TCCCGCAGGC GGATTTCGAT GGCCCGCACA ACCTGATGAT GCAGATCTTC 
ACCTCGCAAG GCGTACAGTT TGATGAAGTG CTGATTTGTC CGCACCTGCC CGCCGATGAG 
TGCGACTGCC GTAAGCCGAA AGTAAAACTG GTGGAGCGTT ATCTGGCTGA GCAAGCGATG 
GATCGCGCCA ACAGTTATGT GATTGGCGAT CGCGCGACCG ACATTCAACT GGCGGAAAAC 
ATGGGCATTA ATGGTTTACG CTACGACCGC GAAACCCTGA ACTGGCCGAT GATTGGCGAG 
CAACTCACTA AACGAGACCG TTACGCCCAT GTAGTGCGCA ACACCAAAGA GACGCAAATT 
GACGTCCAGG TGTGGCTGGA TCGTGAAGGT GGCAGCAAGA TTAATACCGG CGTTGGCTTC 
TTTGATCACA TGCTGGATCA GATCGCCACC CACGGCGGTT TCCGTATGGA AATCAACGTC 
AAAGGCGACC TCTATATCGA CGATCACCAC ACCGTCGAAG ATACCGGCCT GGCGCTGGGT 
GAAGCGTTAA AAATTGCCCT TGGCGACAAA CGCGGTATTT GCCGCTTTGG TTTTGTGCTG 
CCGATGGACG AATGCCTTGC CCGCTGCGCG CTGGATATCT CTGGTCGCCC GCACCTGGAA 
TATAAAGCCG AGTTTACCTA CCAGCGCGTG GGCGATCTCA GCACCGAGAT GATCGAGCAC 
TTCTTCCGTT CGCTCTCATA CACCATGGGC GTGACCCTGC ACCTGAAAAC CAAAGGTAAA 
AACGATCACC ACCGTGTAGA GAGCCTGTTC AAAGCCTTTG GTCGCACCCT GCGCCAGGCC 
ATCCGCGTGG AAGGCGATAC CCTGCCCTCG TCGAAAGGAG TGCTGTAA

Protein sequence

MSQKYLFIDR DGTLISEPPS DFQVDRFDKL AFEPGVIPEL LKLQKAGYKL VMITNQDGLG 
TQSFPQADFD GPHNLMMQIF TSQGVQFDEV LICPHLPADE CDCRKPKVKL VERYLAEQAM 
DRANSYVIGD RATDIQLAEN MGINGLRYDR ETLNWPMIGE QLTKRDRYAH VVRNTKETQI 
DVQVWLDREG GSKINTGVGF FDHMLDQIAT HGGFRMEINV KGDLYIDDHH TVEDTGLALG 
EALKIALGDK RGICRFGFVL PMDECLARCA LDISGRPHLE YKAEFTYQRV GDLSTEMIEH 
FFRSLSYTMG VTLHLKTKGK NDHHRVESLF KAFGRTLRQA IRVEGDTLPS SKGVL