Gene ECH74115_3444 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3444
Symbol
ID	6970258
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	3189240
End bp	3190133
Gene Length	894 bp
Protein Length	297 aa
Translation table	11
GC content	55%
IMG OID	643387250
Product	NAD dependent epimerase/dehydratase family protein
Protein accession	YP_002271713
Protein GI	209400621
COG category	[R] General function prediction only
COG ID	[COG1090] Predicted nucleoside-diphosphate sugar epimerase
TIGRFAM ID	[TIGR01777] conserved hypothetical protein TIGR01777

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0131327
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATAG TGATCACCGG AGGGACGGGA TTAATTGGTC GCCATTTGAT TCCACGTTTG 
CTGGAGCTGG GCCATCAAAT CACGGTAATG ACGCGTAACC CGCAGAAAGC CAGTTCCGTT 
CTCGGCCCTC GGGTGACACT ATGGCAAGGG CTTGCCGATC AAAGCAACCT CAACGGCATT 
GATGCGGTAA TCAACCTGGC CGGAGAACCG ATTGCTGATA AACGTTGGAC TCACGAGCAA 
AAAGAGCGTC TCTGCCAAAG CCGCTGGAAT ATCACGCAAA AACTGGTCGA TTTGATTAAT 
GCCAGCGACA CGCCACCGTC GGTACTCATT TCCGGCTCGG CAACGGGCTA TTATGGCGAC 
TTAGGTGAAG TGGTGGTTAC CGAAGAGGAA CCGCCGCATA ACAAATTTAC CCATAAACTC 
TGCGCCCGCT GGGAAGAAAT TGCCTGTCGG GCGCAAAGTG ACAAAACGCG AGTGTGCCTG 
CTGCGTACCG GCGTAGTGCT GGCACCGGAT GGCGGTATTC TCGGTAAAAT GCTGCCGCCG 
TTTCGTCTTG GCCTGGGCGG GCCGATTGGT TCCGGTCGGC AGTATCTGGC CTGGATTCAT 
ATCGATGATA TGGTCAACGG CATTCTCTGG CTGCTGGATA ACGAGCTGCG CGGGCCATTT 
AATATGGTTT CGCCCTACCC GATACGCAAT GAACAATTTG CCCATGCGCT CGGTCATGCG 
CTGCATCGCC CGGCTATTTT GCGCGTCCCC GCAACCGCCA TTCGGCTGTT AATGGGCGAA 
TCTTCAGTAC TGGTATTAGG TGGACAACGC GCGCTGCCTA AACGGCTGGA AGAAGCGGGT 
TTTGCGTTTC GCTGGTACGA TTTAGAAGAG GCGCTGGCGG ATGTCGTTCG CTGA

Protein sequence

MNIVITGGTG LIGRHLIPRL LELGHQITVM TRNPQKASSV LGPRVTLWQG LADQSNLNGI 
DAVINLAGEP IADKRWTHEQ KERLCQSRWN ITQKLVDLIN ASDTPPSVLI SGSATGYYGD 
LGEVVVTEEE PPHNKFTHKL CARWEEIACR AQSDKTRVCL LRTGVVLAPD GGILGKMLPP 
FRLGLGGPIG SGRQYLAWIH IDDMVNGILW LLDNELRGPF NMVSPYPIRN EQFAHALGHA 
LHRPAILRVP ATAIRLLMGE SSVLVLGGQR ALPKRLEEAG FAFRWYDLEE ALADVVR