Gene ECH74115_4986 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4986
Symbol
ID	6967153
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4636774
End bp	4638033
Gene Length	1260 bp
Protein Length	419 aa
Translation table	11
GC content	57%
IMG OID	643388668
Product	hypothetical protein
Protein accession	YP_002273095
Protein GI	209398044
COG category	[D] Cell cycle control, cell division, chromosome partitioning
COG ID	[COG4942] Membrane-bound metallopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.263173
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACGGG CCGTGAAACC GCGCAGGTTT GCAATCAGGC CCATCATCTA CGCCAGCGTT 
CTTAGCGCTG GCGTATTGTT GTGCGCCTTT TCCGCCCACG CGGATGAGCG TGACCAACTC 
AAATCTATTC AGGCCGATAT CGCCGCAAAA GAGCGCGCGG TACGCCAAAA GCAACAACAA 
CGCGCAAGCC TGCTCGCACA ATTGAAAAAG CAGGAAGAAG CGATCTCTGA AGCCACCCGT 
AAGCTGCGCG AAACGCAAAA CACGCTCAAT CAACTCAATA AACAGATTGA TGAGATGAAC 
GCGTCGATTG CCAAACTGGA GCAGCAAAAA GCCGCCCAGG AGCGCAGCCT CGCCGCACAA 
CTGGATGCCG CATTCCGTCA GGGCGAGCAT ACCGGTATTC AGCTGATTCT CAGCGGTGAA 
GAAAGCCAGC GTGGACAGCG TTTACAGGCT TATTTCGGCT ATCTCAACCA GGCGCGACAA 
GAAACCATTG CCCAGTTGAA GCAAACGCGT GAAGAAGTCG CCATGCAGCG TGCTGAACTG 
GAAGAGAAAC AGAGCGAGCA ACAAACGCTG TTATATGAGC AGCGCGCCCA ACAGGCGAAA 
CTGACTCAGG CGCTGAACGA GCGTAAAAAG ACGCTGGCAG GGCTGGAGTC TTCCATCCAG 
CAAGGTCAGC AACAGTTGAG CGAGCTGCGC GCCAACGAAT CCCGTCTGCG TAACAGCATT 
GCCCGTGCGG AAGCCGCGGC GAAAGCGCGT GCAGAACGAG AAGCACGTGA GGCCCAGGCG 
GTTCGCGACC GCCAGAAAGA AGCGACGCGC AAAGGCACCA CCTACAAACC GACCGAAAGC 
GAAAAATCGC TGATGTCCCG AACTGGTGGC CTGGGGGCGC CGCGTGGTCA GGCATTCTGG 
CCGGTTCGCG GGCCGACGCT GCATCGCTAT GGTGAACAGC TACAGGGCGA ACTACGCTGG 
AAAGGAATGG TTATCGGTGC CTCTGAAGGT ACTGAAGTTA AAGCGATTGC CGATGGTCGG 
GTGATTCTGG CTGACTGGCT GCAAGGTTAC GGTCTGGTGG TGGTGGTTGA GCACGGTAAA 
GGCGACATGA GTCTTTACGG CTATAATCAG AGCGCACTGG TGAGCGTTGG TTCGCAGGTT 
CGCGCGGGCC AGCCAATTGC ACTGGTGGGC AGCAGTGGCG GTCAGGGTCG GCCTTCACTC 
TATTTCGAAA TTCGCCGCCA AGGTCAGGCG GTCAATCCAC AGCCGTGGTT GGGAAGATAA

Protein sequence

MTRAVKPRRF AIRPIIYASV LSAGVLLCAF SAHADERDQL KSIQADIAAK ERAVRQKQQQ 
RASLLAQLKK QEEAISEATR KLRETQNTLN QLNKQIDEMN ASIAKLEQQK AAQERSLAAQ 
LDAAFRQGEH TGIQLILSGE ESQRGQRLQA YFGYLNQARQ ETIAQLKQTR EEVAMQRAEL 
EEKQSEQQTL LYEQRAQQAK LTQALNERKK TLAGLESSIQ QGQQQLSELR ANESRLRNSI 
ARAEAAAKAR AEREAREAQA VRDRQKEATR KGTTYKPTES EKSLMSRTGG LGAPRGQAFW 
PVRGPTLHRY GEQLQGELRW KGMVIGASEG TEVKAIADGR VILADWLQGY GLVVVVEHGK 
GDMSLYGYNQ SALVSVGSQV RAGQPIALVG SSGGQGRPSL YFEIRRQGQA VNPQPWLGR