Gene EcSMS35_2286 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2286
Symbol
ID	6143500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2314068
End bp	2315093
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	49%
IMG OID	641617160
Product	IS110 family transposase
Protein accession	YP_001744333
Protein GI	170682362
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.438286
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	0.00653664
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGTAT CAACTCTTGG TATCGACCTG GCAAAGAACG TTTTTCAGCT TCATGGTGTC 
GATCATGAAG GCCATACTAT TTTGCGTAAA AAGCTCACCC GGGCTAAGTT TGTTCAGTTT 
GTGATTCAAC TGGAACCTTG TCTGATTGGC ATGGAAGCCT GCTCATCCAG TCATTATTTT 
GCGCGATTAT TCACCCGCTA TGGTCATGAG GTAAAACTCA TACCTCCGCA GTATGTGAAG 
CCTTATGTGA AAACGAACAA GACGGATGCA ACAGATGCTG AAGCAATCTG CGAAGCGGTA 
ACACGTCCGA ATATGCGTTT TGTTCAGATA AAAACCGAAG AGCAGCAGGC CGTTTTAGCG 
TTACACACTG AACGGGGAAT ACTTATCCGT GAGCGGATTG CCTGTGCCAA TAGTTTAAGA 
GCCACACTTG CTGAGTTTGG TATTACGATT GCGGCCGGAC AAAACCATTT AACCCGTGAG 
CTGCCAGCCA TTCTGGAGGA TGGCGAAAAT GGTTTATCTC CCTTTGTCAG AACCAGCATC 
TACAGACAGT CTAAACATAT CCGGGAACTT GAAGAACAAG TTAAACAGGT AGAAGAAGCT 
CTGGCCTCCT GGTATAGAAC GCAGGAAGCC TGCCAGAGAA TGGCCAAGAT CCCGGGGGTT 
GGCATGCTAA CGGCCACTTA TGTGGTAGCA GCAGTGGGTA ATGCCCGACA ATTCAGTACC 
GCAAAGCAGT TCGCTTCATG GCTGGGGCTG ACACCAAAGG AACATTCCAG CGGCGGGAAA 
CAGCAACTGG GAGGGATCAG CAAACGTGGA GATGGATATT TCCGATACCT GCTGGTTCAC 
GGCGCACGCG CACTTACCGC CAGGGTCAAC CGAAACGGCG CGGTTGAGAA GAATTCCTGG 
CTTCAGGGAC TCCTTGAGCG GAAGCACTAC AATGTAGCTG TTGTCGCCAT GGCGGCAAAA 
ACAGCGAGGA TCATGTGGTC AATGTTGTCA CACAATACTG AATATCAACC TCGGCAGCTC 
GCCTGA

Protein sequence

MKVSTLGIDL AKNVFQLHGV DHEGHTILRK KLTRAKFVQF VIQLEPCLIG MEACSSSHYF 
ARLFTRYGHE VKLIPPQYVK PYVKTNKTDA TDAEAICEAV TRPNMRFVQI KTEEQQAVLA 
LHTERGILIR ERIACANSLR ATLAEFGITI AAGQNHLTRE LPAILEDGEN GLSPFVRTSI 
YRQSKHIREL EEQVKQVEEA LASWYRTQEA CQRMAKIPGV GMLTATYVVA AVGNARQFST 
AKQFASWLGL TPKEHSSGGK QQLGGISKRG DGYFRYLLVH GARALTARVN RNGAVEKNSW 
LQGLLERKHY NVAVVAMAAK TARIMWSMLS HNTEYQPRQL A