Gene EcSMS35_3144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3144
Symbol
ID	6146122
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	3231313
End bp	3232485
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	53%
IMG OID	641618002
Product	IS2 transposase orfA
Protein accession	YP_001745152
Protein GI	170680910
COG category	[L] Replication, recombination and repair
COG ID	[COG4584] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAGCA GAGAGGACTT TTACATGATA AAGCAAATGC GCCAGCAGGG CGCGTACATT 
GTCGATATTG TGACTCAGAT TGGTTGCTCT GAACGAACGG TCAGACGCTA CCTCAAATAC 
CCTGAACCGC CAGCCAGAAG GACCCGCCAC AAAATGGTTA AGCTGAAACC GTTTATGGAT 
TACATCGACA TGCGCCTGGC AGAGAATGTC TGGAATAGCG CGGTTATCTT CGCGGAGATT 
AAGGCAATGG GCTATACGGG CGGACGTTCC ATGCTGCGTT ACTACATCCA GCCCAACCGT 
AAAATGCGTC CGTCAAAAAG AACAGTTCGC TTCGAAACTC AGCCTGGATA CCAGCTCCAG 
CACGACTGGG GCGAAGTTGA GGTGGAAGTT GCCGGGCAAC GGTGCAAAGT TAACTTTGCG 
GTTAATGCGC TGGGGTTCTC CCGCCGCTTT CATGTCTTCG CTGCCCCAAA ACAGGATGCT 
GAGAATACCT ACGAATCACT GGTTCGCGCC TTCCGCTACT TCGGTGGTTG TGTGAAAACG 
GTGCTGGTTG ATAACCAGAA GGCTGCGGTG CTGAAGAATA ACAACGGGAA AGTCGTGTTC 
AACTCCGGAT TTCTGTTGCT GGCTGACCAC TATAACTTCC TGCCACGGGC ATGCCGTCCA 
CGCAGGGCCA GAACAAAAGG TAAGGTTGAG CGGATGGTGA AATACCTCAA GGAGAACTTC 
TTCGTCCGGT ACCGCAGGTT CGACAGCTTC ACTCATGTCA ATCAACAACT GGAGCAATGG 
ATAGCCGATG TGGCTGACAA ACGGGAGCTT CGTCAGTTCA AAGAAACGCC GGAACAGCGC 
TTCGCGCTGG AGCAGGAATA TCTGCAGCCG TTACCGGATA CGGACTTCGA TACCAGTTAC 
TTTGACATCC GCCATGTGTC CTGGGACAGC TATATCGAGG TTGGTGGTAA TCGTTACAGC 
GTTCCCGAAG CGCTGTGTGG TCAGCCGGTA TCGATACGAA TATCGCTGGA TGACGAGTTG 
CGGATCTACA GTAATGAGAA ACTGGTGGCC TCACATCGCC TCTGTTCGGC ATCGTCTGGC 
TGGCAGACAG TGCCGGAGCA TCACACCCCG CTCTGGCAGC AGGTCAGTCA GGTGGAACAT 
CGACTACTGA GTGCCTATGA GGAGCTGTTG TGA

Protein sequence

MLSREDFYMI KQMRQQGAYI VDIVTQIGCS ERTVRRYLKY PEPPARRTRH KMVKLKPFMD 
YIDMRLAENV WNSAVIFAEI KAMGYTGGRS MLRYYIQPNR KMRPSKRTVR FETQPGYQLQ 
HDWGEVEVEV AGQRCKVNFA VNALGFSRRF HVFAAPKQDA ENTYESLVRA FRYFGGCVKT 
VLVDNQKAAV LKNNNGKVVF NSGFLLLADH YNFLPRACRP RRARTKGKVE RMVKYLKENF 
FVRYRRFDSF THVNQQLEQW IADVADKREL RQFKETPEQR FALEQEYLQP LPDTDFDTSY 
FDIRHVSWDS YIEVGGNRYS VPEALCGQPV SIRISLDDEL RIYSNEKLVA SHRLCSASSG 
WQTVPEHHTP LWQQVSQVEH RLLSAYEELL