Gene ECH74115_3696 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3696
Symbol
ID	6970269
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3414056
End bp	3416071
Gene Length	2016 bp
Protein Length	671 aa
Translation table	11
GC content	55%
IMG OID	643387490
Product	hypothetical protein
Protein accession	YP_002271943
Protein GI	209397566
COG category	[R] General function prediction only
COG ID	[COG1444] Predicted P-loop ATPase fused to an acetyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	94
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAAC TGACTGCGCT TCACACATTA ACAGCGCAAA TGAAACGTGA AGGGATCCGC 
CGCTTGCTGG TGTTGAGCGG GGAAGAGGGT TGGTGTTTTG ATCATGCGCT TAAGTTACGT 
GATGCCTTAC CTGGCGACTG GCTGTGGATT TCGCCGCAGC CAGATGCTGA AAACCACTGT 
TCTCCCTCGG CACTACAAAC TTTACTTGGG CGCGAGTTCC GGCATGCGGT ATTCGACGCC 
CGCCACGGCT TTGATGCCGC TGCCTTTGCC GCACTTAGCG GAACGTTGAA AGCGGGAAGC 
TGGCTGGTTT TGTTACTCCC TGTATGGGAA GAGTGGGAAA ACCAACCTGA TGCCGACTCG 
CTGCGCTGGA GTGATTGCCC TGACCCTATT GCGACGCCGC ATTTTGTCCA GCATTTCAAA 
CGCGTACTTA CGGCGGATAA CGACGCTATC TTCTGGCGGC AAAACCAGCC GTTCTCGTTG 
GCGCATTTTA CTCCCCGTAC TGACTGGCAC CCCGCGACCG GCGCACCACA ACCAGAACAA 
CAGCAAATCT TACAGCAGCT ACTGACCATG CCGTCGGGCG TGGCAGCGGT AACTGCTGCG 
CGTGGGCGCG GTAAATCGGC GCTGGCAGGG CAACTCATTT CTCGTATTGC GGGTAGTGCG 
ATTATCACTG CGCCCGCAAA AGCGGCAACG GATGTACTGG CACAATTTGC GGGCGAGAAG 
TTTCGCTTTA TTGCGCCTGA TGCCTTGTTA GCCAGCGATG AGCAAGCCGA CTGGCTGGTG 
GTCGATGAAG CCGCAGCCAT ACCTGCGCCG TTGTTGCATC AACTGGTATC GCGTTTTCCT 
CGAACGTTGT TAACCACTAC GGTGCAGGGC TACGAAGGTA CCGGACGTGG TTTTTTGCTG 
AAATTTTGCG CTCGCTTTCC GCATTTACAC CGTTTTGAAC TGCAACAGCC GATCCGCTGG 
GCACAGGGAT GCCCGCTGGA AAAAATGGTT AGTGAGGCAC TGGTTTTTAA CGATGAAAAC 
TTCACCCATA CACCACAAGG CAATATCGTC ATTTCCGCAT TTGAACAAAC GTTATGGCGA 
AGCGAGCCAG AAACGCCGTT AAAGGTTTAT CAGTTATTGT CTGGTGCGCA CTACCGGACT 
TCGCCGCTGG ATTTACGCCG CATGATGGAT GCACCAGGGC AACATTTTTT ACAGGCGGCT 
GGCGAAAACG AGATTGCCGG AGCGCTGTGG CTGGTGGATG AGGGGGGATT ATCTCAAGAA 
CTCAGTCAGG CGGTATGGGC AGGTTTTCGT CGCCCGCGGG GTAATCTGGT GGCCCAGTCG 
CTGGCGGCGC ACGGCAGCAA TCCACTGGCG GCGACATTGC GTGGACGGCG GGTCAGCCGG 
ATAGCAGTTC ATCCGGCGCG TCAGCGCGAA GGCGTTGGGC AACAGCTCAT TGCCAGCGCT 
TTGCAATATA GGCCTGGCCT CGACTATCTT TCGGTGAGTT TTGGTTACAC CGGGGAGTTA 
TGGCGTTTCT GGCAACGCTG CGGTTTTGTG CTGGTGCGAA TGGGTAATCA TCGTGAAGCC 
AGCAGCGGTT GCTATACGGC GATGGCGCTG TTACCGATGA GTGATGCGGG TAAACAGCTG 
GCTGAACGTG AGCATTACCG TTTACGTCGC GATGCGCAAG CTCTCGCGCA GTGGAATGGC 
GAAACACTCC CTGTTGATCC ACTAAACAAT GCCGTCCTTT CTGACGACGA CTGGCTTGAA 
CTGGCCGGTT TTGCTTTCGC TCATCGTCCG CTATTAACAT CGTTAGGTTG CTTATTGCGT 
CTGCTACAAA CCAGTGAACT GGCATTACCG GCGCTGCGTG GGCGTTTACA GAAAAACGTC 
AGCGACGCGC AGTTATGTAC CACACTTAAA CTTTCAGGCC GCAAGATGTT ACTGGTCCGT 
CAGCGGGAAG AGGCCGCACA GGCGCTGTTC GCACTTAATG ATGTTCGCAC TGAGCGTCTG 
CGCGATCGCA TAACGCAATG GCAATTTTTT CACTGA

Protein sequence

MAELTALHTL TAQMKREGIR RLLVLSGEEG WCFDHALKLR DALPGDWLWI SPQPDAENHC 
SPSALQTLLG REFRHAVFDA RHGFDAAAFA ALSGTLKAGS WLVLLLPVWE EWENQPDADS 
LRWSDCPDPI ATPHFVQHFK RVLTADNDAI FWRQNQPFSL AHFTPRTDWH PATGAPQPEQ 
QQILQQLLTM PSGVAAVTAA RGRGKSALAG QLISRIAGSA IITAPAKAAT DVLAQFAGEK 
FRFIAPDALL ASDEQADWLV VDEAAAIPAP LLHQLVSRFP RTLLTTTVQG YEGTGRGFLL 
KFCARFPHLH RFELQQPIRW AQGCPLEKMV SEALVFNDEN FTHTPQGNIV ISAFEQTLWR 
SEPETPLKVY QLLSGAHYRT SPLDLRRMMD APGQHFLQAA GENEIAGALW LVDEGGLSQE 
LSQAVWAGFR RPRGNLVAQS LAAHGSNPLA ATLRGRRVSR IAVHPARQRE GVGQQLIASA 
LQYRPGLDYL SVSFGYTGEL WRFWQRCGFV LVRMGNHREA SSGCYTAMAL LPMSDAGKQL 
AEREHYRLRR DAQALAQWNG ETLPVDPLNN AVLSDDDWLE LAGFAFAHRP LLTSLGCLLR 
LLQTSELALP ALRGRLQKNV SDAQLCTTLK LSGRKMLLVR QREEAAQALF ALNDVRTERL 
RDRITQWQFF H