Gene EcSMS35_2537 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2537
Symbol	ypdF
ID	6144040
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2596354
End bp	2597439
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	58%
IMG OID	641617409
Product	aminopeptidase
Protein accession	YP_001744580
Protein GI	170683336
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTAC TCGCTTCGCT GCGCGACTGG CTTAAGGCGC AACAACTGGA TGCGGTGCTT 
CTCTCCTCAC GGCAGAACAA ACAGCCGCAT CTGGGGATCT CCACCGGATC AGGCTATGTG 
CTGATTAGCC GTGAAAGTGC GCACATTCTG GTGGACTCGC GCTATTACGC GGATGTAGAA 
GCCCGCACGC AAGGCTACCA GCTGCATTTG CTTGACGCGA CGCACACGCT TGCAACCATC 
GCCAGGCAAA TCATTGCCGA TGAGCAGTTA AAAACGCTCG GTTTTGAAGG CCAGCAGGTG 
AGTTGGGAAA CCGCGCACCG CTGGCAGTCT GAACTCAATG CGAAACTGGT AAGCGCCACG 
CCGGATGTGC TGCGGCAAAT CAAAACGCCA GAGGAGGTGG AGAAAATCCG CCTCGCCTGT 
GGGATTGCCG ATCGCGGTGC AGAGCATATT CGCCGCTTTA TTCAGGCGGG AATGAGCGAG 
CGCGAGATAG CCGCTGAACT GGAGTGGTTT ATGCGCCAGC AGGGCGCAGA AAAAGCCTCT 
TTCGATACCA TTGTCGCCAG CGGCTGGCGT GGGGCGCTGC CGCACGGCAA AGCCAGCGAC 
AAGATTGTTG CAGCGGGCGA GTTTGTCACT CTTGATTTTG GTGCGCTGTA TCAGGGCTAC 
TGCTCTGATA TGACGCGCAC CTTGCTGGTG AATGGCGAAG GGGTGAGCGC CGAATCTCAC 
CCGCTGTTTG ACGTCTATCA GATTGTTTTG CAGGCACAGC TCGCGGCAAT CTCCGCGATT 
CGCCCCGGCG TGCGCTGCCA GCAGGTTGAC GACGCCGCGC GCCGGGTGAT TACCGAGGCT 
GGATTTGGCG ACTATTTCGG TCATAACACC GGTCATGCTA TCGGCATTGA AGTCCATGAA 
GGTCCGCGTT TTTCACCGCG GGACACCACG ACGCTACAGC CAGGCATGTT ACTGACCGTG 
GAGCCGGGGA TTTATTTGCC AGGGCAAGGG GGCGTGCGCA TCGAAGATGT TGTGCTGGTC 
ACCCCGCAAG GCGCAGAAGT GCTCTACGCC ATGCCGAAAA CAGTGTTGCT CACGGGAGAG 
GCATAA

Protein sequence

MTLLASLRDW LKAQQLDAVL LSSRQNKQPH LGISTGSGYV LISRESAHIL VDSRYYADVE 
ARTQGYQLHL LDATHTLATI ARQIIADEQL KTLGFEGQQV SWETAHRWQS ELNAKLVSAT 
PDVLRQIKTP EEVEKIRLAC GIADRGAEHI RRFIQAGMSE REIAAELEWF MRQQGAEKAS 
FDTIVASGWR GALPHGKASD KIVAAGEFVT LDFGALYQGY CSDMTRTLLV NGEGVSAESH 
PLFDVYQIVL QAQLAAISAI RPGVRCQQVD DAARRVITEA GFGDYFGHNT GHAIGIEVHE 
GPRFSPRDTT TLQPGMLLTV EPGIYLPGQG GVRIEDVVLV TPQGAEVLYA MPKTVLLTGE 
A