Gene EcSMS35_A0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_A0120
Symbol
ID	6106580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010488
Strand	-
Start bp	90229
End bp	91242
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	61%
IMG OID	641614862
Product	integrase/recombinase
Protein accession	YP_001740003
Protein GI	170650836
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID	[TIGR02249] integron integrase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.400978
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCG CCACTGCGCC GTTACCACCG CTGCGTTCGG TCAAGGTTCT GGACCAGTTG 
CGTGAGCGCA TACGCTACTT GCATTACAGT TTACGAACCG AACAGGCTTA TGTCCACTGG 
GTTCGTGCCT TCATCCGTTT CCACGGTGTG CGTCACCCGG CAACCTTGGG CAGCAGCGAA 
GTCGAGGCAT TTCTGTCCTG GCTGGCGAAC GAGCGCAAGG TTTCGGTCTC CACGCATCGT 
CAGGCATTGG CGGCCTTGCT GTTCTTCTAC GGCAAGGTGC TGTGCACGGA TCTGCCCTGG 
CTTCAGGAGA TCGGAAGACC TCGGCCGTCG CGGCGCTTGC CGGTGGTGCT GACCCCGGAT 
GAAGTGGTTC GCATCCTCGG TTTTCTGGAA GGCGAGCATC GTTTGTTCGC CCAGCTTCTG 
TATGGAACGG GCATGCGGAT CAGTGAGGGT TTGCAACTGC GGGTCAAGGA TCTGGATTTC 
GATCACGGCA CGATCATCGT GCGGGAGGGC AAGGGCTCCA AGGATCGGGC CTTGATGTTA 
CCCGAGAGCT TGGCACCCAG CCTGCGCGAG CAGCTGTCGC GTGCACGGGC ATGGTGGCTG 
AAGGACCAGG CCGAGGGCCG CAGCGGCGTT GCGCTTCCCG ACGCCCTTGA GCGGAAGTAT 
CCGCGCGCCG GGCATTCCTG GCCGTGGTTC TGGGTTTTTG CGCAGCACAC GCATTCGACC 
GATCCACGGA GCGGTGTCGT GCGTCGCCAT CACATGTATG ACCAGACCTT TCAGCGCGCC 
TTCAAACGTG CCGTAGAACA AGCAGGCATC ACGAAGCCCG CCACACCGCA CACCCTCCGC 
CACTCGTTCG CGACGGCCTT GCTCCGCAGC GGTTACGACA TTCGAACCGT GCAGGATCTG 
CTCGGCCATT CCGACGTCTC TACGACGATG ATTTACACGC ATGTGCTGAA AGTTGGCGGT 
GCCGGAGTGC GCTCACCGCT TGATGCGCTG CCGCCCCTCA CTAGTGAGAG GTAG

Protein sequence

MKTATAPLPP LRSVKVLDQL RERIRYLHYS LRTEQAYVHW VRAFIRFHGV RHPATLGSSE 
VEAFLSWLAN ERKVSVSTHR QALAALLFFY GKVLCTDLPW LQEIGRPRPS RRLPVVLTPD 
EVVRILGFLE GEHRLFAQLL YGTGMRISEG LQLRVKDLDF DHGTIIVREG KGSKDRALML 
PESLAPSLRE QLSRARAWWL KDQAEGRSGV ALPDALERKY PRAGHSWPWF WVFAQHTHST 
DPRSGVVRRH HMYDQTFQRA FKRAVEQAGI TKPATPHTLR HSFATALLRS GYDIRTVQDL 
LGHSDVSTTM IYTHVLKVGG AGVRSPLDAL PPLTSER