Gene ECH74115_3892 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3892
Symbol
ID	6967250
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3600133
End bp	3601446
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	31%
IMG OID	643387670
Product	site-specific recombinase, phage integrase family protein
Protein accession	YP_002272119
Protein GI	209398276
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAAACA AATGTATTGA AAGTGAGCAA ATCTTTTTTG CTAAGATGAA CAGGTATAGT 
TTCAAACTGT CAGATAAGAA ATGGCAACTG GATAAAGAAA ACTGCGTATA CCCTCATAAA 
GTTGTAGATA GAATGCCTAC AAAAATGAAA CTTAGCTACT TAAAAACATT GGCTTACTAT 
GCGTCTGAAT ATAGTTCTTT TTATATTCAA AGTATTAACA ATCTATTTTA TGAGTGGTTT 
GGTGCGATGA CTATCGATAC TATTGATGAC AAAGCAATAT ATCAATTGAA TGTTTATTTA 
GGTTCAGAAA GAAACTACAA ACTAAACTTA ATTAAGGCTT TCATCATTAA ATGGAAAAAT 
CTCAATTACC CTGGGGTAGA AGCGACTGCC ATTAGAATGC TGGAGAAAAT AAAAATCATT 
CCAAACCAAA CAGGAGATGC AGTTAAAAGA CGAGATCCAA ATAAAGGACC TTTAACTGAA 
GCGGAATTCA ATAACATCAT TAACGCCGTT GGAAAATTTT ATCATGAGAA GAAAATTCAA 
TGCTTTTTGT ATTGTTATAT CCTTTTGCTG GCAATAACAG GAAGAAGGCC ATTACAATTA 
ATATCTCTAA AAGCTAAAGA TCTCATTAAA AATGAGAGAG GGTGCTTTTT GAATGTACCA 
AAAGTAAAAC AAAGAAAATG TTTCAGAAAA GAATTTAACA TGGTTATGAT AGAGCCGTTC 
TTATATGACA GCTTATCAAT GCTAATTAAT CAAAATCAGG CGTTTGTTGA AGATAAATTC 
AGTGTTGGGA TTAGTAACTA TAGAGGCGAA TTACCAATCT TCATGAATTT AGATAAGATT 
ACGGAAACAA AAAGGATTGA GGATTTTTTA TATGATTTAA CAACAGATTT TTTCCATATG 
AAAAATTCAG TTATGTCAAA ACTATTAAAA CACTTTCCGT CAAAATTCGA TGTTAGGTCA 
GAAAGGACTA ACAGCTATAT AGAACTTAAT GCTAGAAGAT TCAGATATAC GTTAGGAAGT 
CGACTGGCTA ATGAAGGAGC CTCAATTGAG GTGATTGCTA AAGCGTTAGA TCATAAATCA 
GTAAACTCTT CTATAATATA TATAAAAAAT AATCCTGACA ACGTTTATGA CATCGATAAG 
AGACTAAGTG CGTTTTTTAA CCCCTTATCT AATATACTTA TGGGCATAGA GATTGAAGAA 
AACAAGAACT TTTTTATCAA GTTTGTTTCA GATGCATTTT TCTTATTGGA AGATACGAAA 
GAGGATTTGA AATGTTTAAC GTGTAAAAAA TTCAATCCCT GGAGAGCATT ATGA

Protein sequence

MENKCIESEQ IFFAKMNRYS FKLSDKKWQL DKENCVYPHK VVDRMPTKMK LSYLKTLAYY 
ASEYSSFYIQ SINNLFYEWF GAMTIDTIDD KAIYQLNVYL GSERNYKLNL IKAFIIKWKN 
LNYPGVEATA IRMLEKIKII PNQTGDAVKR RDPNKGPLTE AEFNNIINAV GKFYHEKKIQ 
CFLYCYILLL AITGRRPLQL ISLKAKDLIK NERGCFLNVP KVKQRKCFRK EFNMVMIEPF 
LYDSLSMLIN QNQAFVEDKF SVGISNYRGE LPIFMNLDKI TETKRIEDFL YDLTTDFFHM 
KNSVMSKLLK HFPSKFDVRS ERTNSYIELN ARRFRYTLGS RLANEGASIE VIAKALDHKS 
VNSSIIYIKN NPDNVYDIDK RLSAFFNPLS NILMGIEIEE NKNFFIKFVS DAFFLLEDTK 
EDLKCLTCKK FNPWRAL