Gene EcSMS35_3112 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3112
Symbol
ID	6143632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3197411
End bp	3198595
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	49%
IMG OID	641617979
Product	site-specific recombinase, phage integrase family protein
Protein accession	YP_001745129
Protein GI	170679820
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0338398
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACTTA CAGCCAGACA GGTCGAAACA GCCAGACCTA AAGAAAAAGA CTATAAACTC 
TCTGACGAAC GTGGTTTATA TCTGCTGGTA AAAACCACGG GTGCCCGCTA CTGGCGGCTT 
AAATACCGGA TAGCAGGAAA AGAGAAAAAA CTGGCCCTCG GCGTCTATCC CGACGTCTCC 
CTTGCTGAGG CCAGAATCAA ACGCGACGAT GCCCGAAAAA TCATCTCCGA AGGTGGTGAC 
CCGGGCGAAA AGAAGCGAAA GGAAAAACTC ACTCAGAAAA TCTCTGCCAC CAATACGTTC 
CATGCCCTCG CTACGGAATG GCACCAGCAT AAATCTTTGT CATGGTCTGA AAGTTACGCC 
AGAAGCGTAC TGGAAGCGCT GGATAAAGAT ATTTTCCCGT ATCTGGGCAA ACGAAGCGTT 
ACGGATATCC TCCCGCTGGA AATGCTGGAA ATTCTGCGCC GCATAGAAAA ACGTGGCTCG 
CTGGAAAAAC TTCGTAAGGT GCGTCAATAC TGTAATCAGA TTTTTCGTTA TGCCATCGCC 
ACCGGACGAG CCACTGTCAA TCCGGCATCT GAACTGACCA GTACGCTGGC GGCGCCAAAA 
GCTGCACATT TCCCCCACCT GAGAGCAGAT GAGCTCCCTG TTTTTCTCCG GAAGCTCGCT 
GAGTATCATG GCAGTCCTGT TACCCGCATG GCGACAAATC TGCTGCTTCT GACAGGTCTC 
AGAACCATTG AGCTACGGTC CGCTGAATGG TCAGAAATTG ATTTTGATAA TGCACTGTGG 
ACAATCCCTG AAAGCCGCAT GAAAATGCGA CGTAAACATG TCGTACCACT GTCACGACAG 
GCCACTGACA TTCTGCTGCA GCTCAAAACT TTCTCCGGGC AATACCGGCT GGTTTTTCCG 
GGACGTTGTG ATATCAACAA GCCAATGAGC GAAGCCAGCA TCAATATGGT GCTCAAACGT 
ATCGGTTACG ATGGCAGGGC AACCGGTCAT GGTTTTCGTC ACACCATGAG TACCATTCTG 
CACGAACAGG GCTTTAATTC TGCCTGGATT GAAATGCAGT TAGCTCATGT GGATAAAAAT 
TCCATCAGGG GTACCTATAA TCATGCCCTG TATCTCGATG GTCGCCGTGA AATGATGCAA 
TGGTACGCTG ACTACATTGA TTCACTTTCC ATCCAGGAGA GTTAA

Protein sequence

MALTARQVET ARPKEKDYKL SDERGLYLLV KTTGARYWRL KYRIAGKEKK LALGVYPDVS 
LAEARIKRDD ARKIISEGGD PGEKKRKEKL TQKISATNTF HALATEWHQH KSLSWSESYA 
RSVLEALDKD IFPYLGKRSV TDILPLEMLE ILRRIEKRGS LEKLRKVRQY CNQIFRYAIA 
TGRATVNPAS ELTSTLAAPK AAHFPHLRAD ELPVFLRKLA EYHGSPVTRM ATNLLLLTGL 
RTIELRSAEW SEIDFDNALW TIPESRMKMR RKHVVPLSRQ ATDILLQLKT FSGQYRLVFP 
GRCDINKPMS EASINMVLKR IGYDGRATGH GFRHTMSTIL HEQGFNSAWI EMQLAHVDKN 
SIRGTYNHAL YLDGRREMMQ WYADYIDSLS IQES