Gene EcE24377A_2807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_2807
Symbol	pepB
ID	5587749
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	-
Start bp	2805148
End bp	2806431
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	56%
IMG OID	640926458
Product	aminopeptidase B
Protein accession	YP_001463845
Protein GI	157155395
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.964812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAGAAG CGATGAAGAT TACCCTCTCT ACCCAACCTG CCGACGCGCG CTGGGGAGAA 
AAAGCAACTT ACAGCATTAA TAATGACGGC ATTACCCTGC ATTTGAACGG GGCAGACGAT 
CTGGGGCTGA TCCAGCGTGC GGCGCGCAAG ATTGACGGTC TGGGCATCAA GCATGTTCAG 
TTAAGCGGTG AAGGCTGGGA TGCGGATCGC TGCTGGGCAT TCTGGCAAGG TTACAAAGCC 
CCGAAAGGCA CGCGTAAAGT GGAGTGGCCG GATCTGGACG ATGCCCAGCG CCAGGAACTG 
GATAACCGCC TGATGATCAT CGACTGGGTG CGTGACACCA TCAACGCACC GGCAGAAGAA 
TTGGGACCAT CGCAACTGGC ACAGCGTGCT GTTGATCTGA TCAGCAACGT CGCGGGCGAT 
CGTGTGACTT ATCGGATCAC CAAAGGCGAA GATCTGCGTG AGCAAGGTTA TATGGGGCTG 
CACACAGTCG GACGCGGTTC AGAACGTTCT CCGGTATTGC TGGCGCTGGA TTACAACCCA 
ACTGGCGATA AAGAAGCGCC AGTGTACGCG TGCCTGGTAG GTAAAGGTAT CACTTTTGAC 
TCCGGCGGCT ACAGCATCAA ACAGACTGCG TTTATGGACT CGATGAAGTC GGACATGGGC 
GGCGCGGCAA CGGTTACCGG GGCGCTGGCA TTTGCCATTA CGCGCGGACT GAACAAGCGC 
GTGAAGCTGT TCCTCTGCTG TGCGGATAAC CTGATTAGCG GCAATGCGTT CAAGCTGGGC 
GATATCATCA CCTATCGCAA CGGTAAAAAA GTTGAAGTGA TGAACACTGA TGCCGAAGGG 
CGTCTGGTGC TGGCCGATGG TCTGATTGAT GCCAGTGCGC AGAAACCGGA ACTGATCATT 
GATGCGGCGA CCCTCACCGG GGCGGCGAAA ACTGCGCTGG GTAATGATTA TCACGCGCTG 
TTCAGTTTTG ACGATGCGCT TGCCGGTCGT TTGCTGGCGA GTGCCTCACA AGAGAACGAA 
CCATTCTGGC GTCTGCCGCT GGCGGAATTC CACCGCAGCC AGCTGCCGTC TAACTTTGCC 
GAACTGAACA ATACCGGAAG CGCGGCGTAT CCGGCAGGCG CGAGCACGGC GGCGGGCTTC 
CTGTCGCACT TTGTTGAGAA CTATCAGCAA GGCTGGCTGC ATATCGACTG CTCGGCGACT 
TACCGTAAAG CGCCGGTTGA ACAGTGGTCT GCGGGCGCTA CGGGACTTGG TGTGCGCACG 
ATAGCTAATC TGTTAACGGC GTAA

Protein sequence

MTEAMKITLS TQPADARWGE KATYSINNDG ITLHLNGADD LGLIQRAARK IDGLGIKHVQ 
LSGEGWDADR CWAFWQGYKA PKGTRKVEWP DLDDAQRQEL DNRLMIIDWV RDTINAPAEE 
LGPSQLAQRA VDLISNVAGD RVTYRITKGE DLREQGYMGL HTVGRGSERS PVLLALDYNP 
TGDKEAPVYA CLVGKGITFD SGGYSIKQTA FMDSMKSDMG GAATVTGALA FAITRGLNKR 
VKLFLCCADN LISGNAFKLG DIITYRNGKK VEVMNTDAEG RLVLADGLID ASAQKPELII 
DAATLTGAAK TALGNDYHAL FSFDDALAGR LLASASQENE PFWRLPLAEF HRSQLPSNFA 
ELNNTGSAAY PAGASTAAGF LSHFVENYQQ GWLHIDCSAT YRKAPVEQWS AGATGLGVRT 
IANLLTA