Gene EcSMS35_3005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_3005
Symbol
ID	6145245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	3087745
End bp	3088956
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	52%
IMG OID	641617874
Product	peptidase
Protein accession	YP_001745025
Protein GI	170684131
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR03320] M20/DapE family protein YgeY [TIGR03526] putative selenium metabolism hydrolase

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAAGA ATATTCCATT CAAACTGATT CTTGAAAAAG CAAAAGATTA CCAGGCGGAC 
ATGACTCGCT TCCTGCGCGA CATGGTTGCT ATTCCCAGTG AAAGCTGCGA CGAAAAACGC 
GTAGTACATC GTATTAAAGA AGAGATGGAA AAAGTCGGCT TCGATAAAGT TGAAATCGAC 
CCGATGGGCA ACGTTCTCGG TTATATCGGC CACGGCCCGC GTCTGGTGGC AATGGACGCT 
CATATTGATA CCGTCGGCAT TGGCAACATC AAAAACTGGG ACTTCGATCC GTACGAAGGC 
ATGGAAACTG ATGAGCTGAT CGGTGGTCGC GGTACTTCCG ACCAGGAAGG CGGCATGGCA 
TCTATGGTTT ATGCCGGTAA AATCATTAAA GACCTCGGTC TGGAAGATGA ATATACCCTG 
CTGGTTACCG GTACTGTGCA GGAAGAAGAC TGCGACGGTC TGTGCTGGCA GTACATTATT 
GAACAATCCG GCATTCGCCC GGAATTTGTG GTCAGTACCG AACCAACCGA CTGCCAGGTA 
TACCGTGGTC AGCGCGGTCG TATGGAAATT CGTATTGATG TTCAGGGTGT TAGCTGCCAC 
GGTTCTGCGC CAGAACGCGG TGACAACGCC ATTTTCAAAA TGGGTCCGAT TCTTGGCGAA 
TTACAAGAAC TCTCCCAACG TCTGGGTTAT GACGAATTCC TCGGCAAAGG CACCCTCACC 
GTTTCTGAAA TCTTCTTCAC ATCCCCAAGC CGTTGCGCTG TAGCAGATAG CTGCGCCGTC 
TCTATTGACC GCCGTCTGAC CTGGGGCGAA ACCTGGGAAG GCGCGCTGGA CGAAATCCGC 
GCCCTGCCTG CAGTACAGAA AGCTAACGCG GTTGTTTCTA TGTACAACTA CGACCGTCCG 
TCCTGGACTG GCCTGGTTTA CCCAACCGAA TGCTACTTCC CGACCTGGAA AGTGGAAGAA 
GATCACTTCA CCGTTAAAGC ACTGGTGAAT GCCTACGAAG GTCTGTTTGG CAAAGCGCCG 
GTTGTTGATA AGTGGACCTT CTCAACTAAC GGCGTATCTA TCATGGGCCG TCACGGCATT 
CCGGTGATCG GCTTTGGCCC AGGTAAAGAA CCTGAAGCGC ATGCACCTAA CGAAAAAACC 
TGGAAATCTC ACCTGGTGAC CTGTGCCGCG ATGTACGCGG CAATCCCGTT AAGCTGGCTG 
GCAACCGAAT AA

Protein sequence

MAKNIPFKLI LEKAKDYQAD MTRFLRDMVA IPSESCDEKR VVHRIKEEME KVGFDKVEID 
PMGNVLGYIG HGPRLVAMDA HIDTVGIGNI KNWDFDPYEG METDELIGGR GTSDQEGGMA 
SMVYAGKIIK DLGLEDEYTL LVTGTVQEED CDGLCWQYII EQSGIRPEFV VSTEPTDCQV 
YRGQRGRMEI RIDVQGVSCH GSAPERGDNA IFKMGPILGE LQELSQRLGY DEFLGKGTLT 
VSEIFFTSPS RCAVADSCAV SIDRRLTWGE TWEGALDEIR ALPAVQKANA VVSMYNYDRP 
SWTGLVYPTE CYFPTWKVEE DHFTVKALVN AYEGLFGKAP VVDKWTFSTN GVSIMGRHGI 
PVIGFGPGKE PEAHAPNEKT WKSHLVTCAA MYAAIPLSWL ATE