Gene ECH74115_0306 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_0306
Symbol
ID	6968335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	314636
End bp	315868
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	45%
IMG OID	643384371
Product	site-specific recombinase, phage integrase family
Protein accession	YP_002268886
Protein GI	209397533
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.644103
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGTATAG GATTGTGTAT ATGTTCCTGT TCGGTCTGGA TTCCTATACA CATGCCTTTA 
AACGATATGC AGATTCGCCG CGCTAAGCCT GAAGCTAAAG CCTATACATT TGGAGATGGG 
CTAGGGTTGT CATTACTTAT AGAACCTAAT GGAAGCAAGA GTTGGCGGTT CCGCTATCGC 
TATGCCGGCA AACCCAAAAT GATCTCGCTT GGTGTTTACC CAACGATCAC CCTTGCCGAT 
GCTCGTTCCC GTCGTGATGA AGCTCGAAAA CTTGTGGCAG AAGGAAAGAA CCCTAGTGAG 
GTTCGAAAAG AGCAAAAGCT AGCTATGCAA ACAGAGTCAG AGAACGCCTT CGAAAAGATA 
GCCAGAGAGT GGCATCAACT TAAATCTGCT AAATGGTCGG CGGGATATGC ATCAGACATC 
ATGGAAGCGT TTAAGAACGA CATTTTTCCT TATGTCGGAA CAAGGCCTGT GGGAGAGATT 
AAACCGCTAG AGCTGCTGAA CGTTCTGCGT AAAATTGAGA AACGTGGTGC GTTGGAGAAA 
ATGCGCAAAG TGCGGCAGCG TTGCTCCGAA GTGAACCGCC CCGCAATTGC AACGGGTAGG 
GCGGAGTACA ATCCTGCGGC TGATCTCTCC AGCGCTCTCG AAGTACACCA ATCCAATCAT 
TTCCCATTCC TAAAAGCTGA TGAGATACCT GATTTTCTAC GTGCCTTAGA GGGTTACTCC 
GGGAGTAAGC TTGTCCAGAT AGCCACGAAA TTACTGATGA TTACGGGTGT GAGAACCATC 
GAATTACGCG CGGCATTATG GCAAGAATTT GATCTGGATA ACGCTATTTG GGAAATTCCT 
GCTGAAAGGA TGAAAATGCG TAGGCCACAT CTTGTGCCCT TATCATCTCA AGCGGTAGAT 
TTACTCAATG AACTCAAGAT CATGACAGGG AACTATCGTT ATGTTTTTCC AGGGCGGAAC 
GATCCGAATA GGCCAATGAG CGAAGCGAGT ATAAATCAAG CCATTAAGCG TATTGGGTAT 
GGAGGAAAAG TCACTGGACA TGGTTTTCGT CATACCCTTT CTACAATCCT GCATGAGCAA 
GGTTTTGAGA GTGCTTGGAT TGAAATCCAG TTGGCTCATG TAGATAAAAA TTCTATTAGG 
GGGACTTATA ACCATGCTCA ATATTTTAGT GGAAGGAAGT CTATGATGGA CTGGTACAGT 
AATTTGATAT TTGAAAGACT AAAAAGGAGT TAA

Protein sequence

MCIGLCICSC SVWIPIHMPL NDMQIRRAKP EAKAYTFGDG LGLSLLIEPN GSKSWRFRYR 
YAGKPKMISL GVYPTITLAD ARSRRDEARK LVAEGKNPSE VRKEQKLAMQ TESENAFEKI 
AREWHQLKSA KWSAGYASDI MEAFKNDIFP YVGTRPVGEI KPLELLNVLR KIEKRGALEK 
MRKVRQRCSE VNRPAIATGR AEYNPAADLS SALEVHQSNH FPFLKADEIP DFLRALEGYS 
GSKLVQIATK LLMITGVRTI ELRAALWQEF DLDNAIWEIP AERMKMRRPH LVPLSSQAVD 
LLNELKIMTG NYRYVFPGRN DPNRPMSEAS INQAIKRIGY GGKVTGHGFR HTLSTILHEQ 
GFESAWIEIQ LAHVDKNSIR GTYNHAQYFS GRKSMMDWYS NLIFERLKRS