Gene EcSMS35_1714 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_1714
Symbol
ID	6144119
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	1721250
End bp	1723226
Gene Length	1977 bp
Protein Length	658 aa
Translation table	11
GC content	45%
IMG OID	641616590
Product	metallo-beta-lactamase family protein
Protein accession	YP_001743768
Protein GI	170683013
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2015] Alkyl sulfatase and related hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.0306095
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGCTTA ATCATATTGT TAAAAGTCTG CTAATAACGG GATTATTCAC CACCAGTTCT 
TTGCCACTCC TCGCGGCGGA AGCCCCTAAA GACGCCACCG CAGCCACGCA ACAAGCAAAC 
AATTTACTCT ACAACCAGTT GCCGTTTTCT GATAACACTG ACTTTACTGA TGCCCATAAA 
GGTTTTGTTG CCCCTATCCC TCAAGACGTG ATTAAGGGCG AAAAAGGAAA TGTTATCTGG 
GATCCACAAC AATACGCTTT TATTAAAGAA GGTGATAAAG CCCCTGATAC GGTGAATCCA 
AGTTTATGGC GTCAGGCGCA ACTGATAAAT ATCAGCGGGT TATTCGAAGT AACTGAAGGT 
GTCTATCAGA TTCGCAATCT CGATCTATCA AATATGACCA TCATTGAAGG CAAAGAGGGT 
ATTACCATCG TTGATCCCCT TGTTTCAGCA GAAACAGCCA AAGTGGGTAT GGATCTCTAT 
TACAAAAATC GCGACAAAAA ACCGGTAGTA GCGGTTATCT ACACACACAG TCATGTCGAT 
CACTACGGTG GTGTTCGCGG CGTAATTGAT GAAGCTGACG TTAAATCAGG CAAAGTTAAA 
ATCTACGCGC CAGCCGGATT TTTGGAGGAA GCCGTTTCCG AAAATATTAT GGCTGGCAAT 
GTGATGAGCC GACGAGCCAG TTATATGTAT GGCAACTTAT TGAAACCTGA TGTTAAAGGC 
CAGGTTGGCG CGGGACTGGG AACAACCACT TCAGCAGGAA CGGTCACGTT GATTGCTCCT 
ACTAACTACA TCACCAAAAC CGGACAAAAA GAAACTATTG ACGGGTTGAC CTATGATTTC 
TTGATGGCGC CAGGCTCTGA AGCGCCTTCT GAAATGCTGT GGTTTATTGA AGAAAAGAAA 
CTGATCGAAA CCGCTGAAGA TGTCACGCAC ACCCTTCATA ACACCTATTC GCTGCGTGGG 
GCTAAAATTC GCCAACCGCT GCCGTGGTCA AAATATATTA ACGAAGCTCT CAATTTATGG 
GGAGATAAAG CCGAGATTAT TCTCGCTCAA CATCACTGGC CAACCTGGGG CAACGATAAC 
GTGGTCAAAC TGCTTAAAAG CCAGCGTGAT TTGTATCGTT ACATCAATGA TCAAACTCTG 
CGTATGGCAA ATCAAGGGAT GACCCGTGAT GAAATTGCCG CAAACTTTAA ACTGCCCTCT 
TCACTGGCTA ATACCTGGGC GAATCGCGGC TATTACGGTT CGGTAAGTCA TGACGTGAAA 
GCAACTTACG TGCTTTATCT CGGCTGGTTT GATGGTAACC CCGCGACGCT TGATGAACTG 
CCGCCAGAAG AAGGCGCAAA AAAATTCGTC GAGTATATGG GCGGTGCTGA TGCCATTTTA 
CAGAAAGCCA AACAGGATTA TGACCAGGGT AATTTCCGCT GGGTTGCCCA AGTTGTTAGT 
AAGGTGGTGT TTACCGATCC AAACAACCAG GCAGCGAGAA ATCTGGAAGC TGATGCGCTT 
GAGCAGTTAG GCTATCAGGC TGAATCTGGG CCGTGGCGTA ATTTCTATCT CACTGGCGCA 
CAGGAATTGC GTAATGGCGT ACAAAAATTA CCAACACCAA ATACTGCCAG CCCAGACACC 
GTGCGTGCGA TGACGCCGGA GATGTTCTTT GATTATCTTG CCGTCCATAT TAATGGTGAG 
AAAGCGGCAG ATGCCAAAAC CGTGTTGAAT TTCGATTTTG GTGAAGATGG CGGCACCTAT 
AAAGTGGAGC TTGAAAATGG TGTTCTCAAT CATACCGCTG GTGTAGAGGC TTCGGATGCT 
GATGCCACTA TCACTCTGTC TCGTGATGTA TTGAACAAAA TTGTACTGAA AGAAGAGACG 
CTGAAAGAAG CCACGGCCAA AGAAGATGTC AAAATTACTG GCAATGCGGA AAAACTCAAC 
GAGCTGTTAG GTTATATGGA TAATTTTGAA TTTTGGTTCA ATATAGTGAC ACCATAA

Protein sequence

MQLNHIVKSL LITGLFTTSS LPLLAAEAPK DATAATQQAN NLLYNQLPFS DNTDFTDAHK 
GFVAPIPQDV IKGEKGNVIW DPQQYAFIKE GDKAPDTVNP SLWRQAQLIN ISGLFEVTEG 
VYQIRNLDLS NMTIIEGKEG ITIVDPLVSA ETAKVGMDLY YKNRDKKPVV AVIYTHSHVD 
HYGGVRGVID EADVKSGKVK IYAPAGFLEE AVSENIMAGN VMSRRASYMY GNLLKPDVKG 
QVGAGLGTTT SAGTVTLIAP TNYITKTGQK ETIDGLTYDF LMAPGSEAPS EMLWFIEEKK 
LIETAEDVTH TLHNTYSLRG AKIRQPLPWS KYINEALNLW GDKAEIILAQ HHWPTWGNDN 
VVKLLKSQRD LYRYINDQTL RMANQGMTRD EIAANFKLPS SLANTWANRG YYGSVSHDVK 
ATYVLYLGWF DGNPATLDEL PPEEGAKKFV EYMGGADAIL QKAKQDYDQG NFRWVAQVVS 
KVVFTDPNNQ AARNLEADAL EQLGYQAESG PWRNFYLTGA QELRNGVQKL PTPNTASPDT 
VRAMTPEMFF DYLAVHINGE KAADAKTVLN FDFGEDGGTY KVELENGVLN HTAGVEASDA 
DATITLSRDV LNKIVLKEET LKEATAKEDV KITGNAEKLN ELLGYMDNFE FWFNIVTP