Gene ECH74115_3617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_3617
Symbol	ypdF
ID	6966630
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	3337797
End bp	3338882
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	57%
IMG OID	643387412
Product	aminopeptidase
Protein accession	YP_002271871
Protein GI	209397138
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTAC TCGCTTCGCT GCGCGACTGG CTTAAGGCGC AACAACTGGA TGCGGTGCTT 
CTCTCCTCAC GGCAGAACAA ACAGCCGCAT CTGGGGATCT CCACCGGATC AGGCTATGTG 
CTGATTAGCC GTGAAAGTGC GCACATTCTG GTGGACTCGC GCTATTACGC GGATGTAGAA 
GCCCGCACGC AAGGTTACCA GCTGCATTTG CTTGACGCGA CGCACACGCT TACAACCATC 
GCCAGGCAAA TCATTGCCGA TGAGCAGTTG CAAACGCTCG GTTTTGAAGG CCAGCAGGTG 
AGTTGGGAAA CCGCGCATCG CTGGCAGTCT GAACTCAATG CGAAACTGGT TAGCGCCACG 
CCGGATGTGC TGCGGCAAAT CAAAACGCCA GAGGAGGTGG AGAAAATCCG CCTTGCCTGT 
GGGATTGCCG ATCGCGGTGC AGAGCATATT CGCCGCTTTA TTCAGGCGGG GATGAGCGAG 
CGCGAGATAG CCGCTGAACT GGAGTGGTTT ATGCGCCAGC AGGGCGCAGA AAAAACCTCT 
TTTGACACCA TTGTCGCCAG TGGCTGGCGT GGGGCGCTGC CGCACGGCAA AGCCAGCGAC 
AAGATTGTTG CAGCGGGCGA GTTTGTCACT CTCGATTTCG GTGCGCTCTA TCAGGGCTAC 
TGCTCTGATA TGACGCGCAC CTTGCTGGTG AATGGCGAAG GGGTGAGCGC CGAATCTCAC 
CCGCTGTTTA ACGTCTATCA GATTGTTTTG CAGGCACAGC TCGCAGCAAT CTCTGCAATT 
CGCCCCGGCG TGCGCTGCCA GCAGGTTGAC GAAGCCGCGC GTCGGGTGAT TACCGAGGCA 
GGTTTTAGCC ACTATTTCGG TCATAACACC GCTCATGCTA TCGGCATTGA AGTTCATGAA 
GATCCGCGTT TTTCACCGCG GGACACCACG ACGCTACAGC CAGGCATGTT ACTGACCGTG 
GAGCCGGGGA TTTATTTGCC AGGGCAAGGG GGCGTGCGCA TCGAGGATGT TGTGCTGGTC 
ACCCCGCAAG GCGCAGAAGT GCTCTACGCC ATGCCGAAAA CAGTGTTGCT CACGGGAGAG 
GCATAA

Protein sequence

MTLLASLRDW LKAQQLDAVL LSSRQNKQPH LGISTGSGYV LISRESAHIL VDSRYYADVE 
ARTQGYQLHL LDATHTLTTI ARQIIADEQL QTLGFEGQQV SWETAHRWQS ELNAKLVSAT 
PDVLRQIKTP EEVEKIRLAC GIADRGAEHI RRFIQAGMSE REIAAELEWF MRQQGAEKTS 
FDTIVASGWR GALPHGKASD KIVAAGEFVT LDFGALYQGY CSDMTRTLLV NGEGVSAESH 
PLFNVYQIVL QAQLAAISAI RPGVRCQQVD EAARRVITEA GFSHYFGHNT AHAIGIEVHE 
DPRFSPRDTT TLQPGMLLTV EPGIYLPGQG GVRIEDVVLV TPQGAEVLYA MPKTVLLTGE 
A