Gene EcSMS35_4777 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4777
Symbol
ID	6146669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4872207
End bp	4873415
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	45%
IMG OID	641619587
Product	IS10 transposase
Protein accession	YP_001746694
Protein GI	170682497
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.271469
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	0.676926
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGCGAAC TCGATATTTT ACACGACTCT CTTTACCAAT TCTGCCCCGA ATTACACTTA 
AAACGACTCA ACAGCTTAAC GTTGGCTTGC CACGCATTAC TTGACTGTAA AACTCTCACT 
CTTACCGAAC TTGGCCGTAA CCTGCCAACC AAAGCGAGAA CAAAACATAA CATCAAACGA 
ATCGACCGAT TGTTAGGTAA TCGTCACCTC CACAAAGAGC GACTCGCTGT ATACCGTTGG 
CATGCTAGCT TTATCTGTTC GGGCAATACG ATGCCCATTG TACTTGTTGA CTGGTCTGAT 
ATTCGTGAGC AAAAACGACT TATGGTATTG CGAGCTTCAG TCGCACTACA CGGTCGTTCT 
GTTACTCTTT ATGAGAAAGC GTTCCCGCTT TCAGAGCAAT GTTCAAAGAA AGCTCATGAC 
CAATTTCTAG CCGACCTTGC GAGCATTCTA CCGAGTAACA CCACACCGCT CATTGTCAGT 
GATGCTGGCT TTAAAGTGCC ATGGTATAAA TCCGTTGAGA AGCTGGGTTG GTACTGGTTA 
AGTCGAGTAA GAGGAAAAGT ACAATATGCA GACCTAGGAG CGGAAAACTG GAAACCTATC 
AGCAACTTAC ATGATATGTC ATCTAGTCAC TCAAAGACTT TAGGCTATAA GAGGCTGACT 
AAAAGCAATC CAATCTCATG CCAAATTCTA TTGTATAAAT CTCGCTCTAA AGGCCGAAAA 
AATCAGCGCT CGACACGGAC TCATTGTCAC CACCCGTCAC CTAAAATCTA CTCAGCGTCG 
GCAAAGGAGC CATGGGTTCT AGCAACTAAC TTACCTGTTG AAATTCGAAC ACCCAAACAA 
CTTGTTAATA TCTATTCGAA GCGAATGCAG ATTGAAGAAA CCTTCCGAGA CTTGAAAAGT 
CCTGCCTACG GACTAGGCCT ACGCCATAGC CGAACGAGCA GCTCAGAGCG TTTTGATATC 
ATGCTGCTAA TCGCCCTGAT GCTTCAACTA ACATGTTGGC TTGCGGGCGT TCATGCTCAG 
AAACAAGGTT GGGACAAGCA CTTCCAGGCT AACACAGTCA GAAATCGAAA CGTACTCTCA 
ACAGTTCGCT TAGGCATGGA AGTTTTGCGG CATTCTGGCT ACACAATAAC AAGGGAAGAC 
TTACTCGTGG CTGCAACCCT ACTAGCTCAA AATTTATTCA CACATGGTTA CGCTTTGGGG 
AAATTATGA

Protein sequence

MCELDILHDS LYQFCPELHL KRLNSLTLAC HALLDCKTLT LTELGRNLPT KARTKHNIKR 
IDRLLGNRHL HKERLAVYRW HASFICSGNT MPIVLVDWSD IREQKRLMVL RASVALHGRS 
VTLYEKAFPL SEQCSKKAHD QFLADLASIL PSNTTPLIVS DAGFKVPWYK SVEKLGWYWL 
SRVRGKVQYA DLGAENWKPI SNLHDMSSSH SKTLGYKRLT KSNPISCQIL LYKSRSKGRK 
NQRSTRTHCH HPSPKIYSAS AKEPWVLATN LPVEIRTPKQ LVNIYSKRMQ IEETFRDLKS 
PAYGLGLRHS RTSSSERFDI MLLIALMLQL TCWLAGVHAQ KQGWDKHFQA NTVRNRNVLS 
TVRLGMEVLR HSGYTITRED LLVAATLLAQ NLFTHGYALG KL