Gene ECD_04126 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECD_04126
Symbol	pepA
ID	0
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli BL21(DE3)
Kingdom	Bacteria
Replicon accession	CP001509
Strand	-
Start bp	4396032
End bp	4397543
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	55%
IMG OID
Product	leucyl aminopeptidase
Protein accession	ACT45914
Protein GI	253980244
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0158539
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGTTTA GTGTAAAAAG CGGTAGCCCG GAGAAACAGC GGAGTGCCTG CATCGTCGTG 
GGCGTCTTCG AACCACGTCG CCTTTCTCCG ATTGCAGAAC AGCTCGATAA AATCAGCGAT 
GGGTACATCA GCGCCCTGCT ACGTCGGGGC GAACTGGAAG GAAAACCGGG GCAGACATTG 
TTGCTGCACC ATGTTCCGAA TGTACTTTCC GAGCGAATTC TCCTTATTGG TTGCGGCAAA 
GAACGTGAGC TGGATGAGCG TCAGTACAAG CAGGTTATTC AGAAAACCAT TAATACGCTG 
AATGATACTG GCTCAATGGA AGCGGTCTGC TTTCTGACTG AACTGCACGT TAAAGGCCGT 
AATAACTACT GGAAAGTGCG TCAGGCTGTC GAGACGGCAA AAGAGACGCT CTACAGTTTC 
GATCAGCTGA AAACGAACAA GAGCGAACCG CGTCGCCCGC TGCGTAAAAT GGTGTTCAAC 
GTGCCGACCC GCCGTGAACT GACCAGCGGT GAGCGCGCGA TCCAGCACGG TCTGGCGATT 
GCCGCCGGGA TTAAAGCAGC GAAAGATCTC GGCAATATGC CGCCGAATAT CTGTAACGCC 
GCTTACCTCG CTTCACAAGC GCGCCAGCTG GCTGACAGCT ACAGCAAGAA TGTTATCACC 
CGCGTTATCG GCGAACAGCA GATGAAAGAG CTGGGGATGC ATTCCTATCT GGCGGTCGGT 
CAGGGTTCGC AAAACGAATC GCTGATGTCG GTGATTGAGT ACAAAGGCAA CGCGTCGGAA 
GATGCACGCC CAATCGTGCT GGTGGGTAAA GGTTTAACCT TCGACTCCGG CGGTATCTCG 
ATCAAGCCTT CAGAAGGCAT GGATGAGATG AAGTACGATA TGTGCGGTGC GGCAGCGGTT 
TACGGCGTGA TGCGGATGGT CGCGGAGCTA CAACTGCCGA TTAACGTTAT CGGCGTGTTG 
GCAGGCTGCG AAAACATGCC TGGCGGGCGT GCCTATCGTC CGGGCGATGT GTTAACCACC 
ATGTCCGGTC AAACCGTTGA AGTGCTGAAT ACCGACGCTG AAGGCCGCCT GGTACTGTGC 
GACGTGTTAA CTTACGTTGA GCGTTTTGAG CCGGAAGCGG TGATTGACGT GGCGACGCTG 
ACCGGTGCCT GCGTGATCGC GCTGGGTCAT CACATTACCG GTCTGATGGC GAACCATAAT 
CCGCTGGCCC ATGAACTGAT TGCCGCGTCT GAACAATCCG GTGACCGCGC ATGGCGCTTA 
CCGCTGGGTG ACGAGTATCA GGAACAACTG GAGTCCAATT TTGCCGATAT GGCGAACATT 
GGCGGTCGTC CTGGTGGGGC GATTACCGCA GGTTGCTTCC TGTCACGCTT TACCCGTAAG 
TACAACTGGG CGCACCTGGA TATCGCCGGT ACCGCCTGGC GTTCTGGTAA AGCAAAAGGC 
GCCACCGGTC GTCCGGTAGC GTTGCTGGCA CAGTTCCTGT TAAACCGCGC TGGGTTTAAC 
GGCGAAGAGT AA

Protein sequence

MEFSVKSGSP EKQRSACIVV GVFEPRRLSP IAEQLDKISD GYISALLRRG ELEGKPGQTL 
LLHHVPNVLS ERILLIGCGK ERELDERQYK QVIQKTINTL NDTGSMEAVC FLTELHVKGR 
NNYWKVRQAV ETAKETLYSF DQLKTNKSEP RRPLRKMVFN VPTRRELTSG ERAIQHGLAI 
AAGIKAAKDL GNMPPNICNA AYLASQARQL ADSYSKNVIT RVIGEQQMKE LGMHSYLAVG 
QGSQNESLMS VIEYKGNASE DARPIVLVGK GLTFDSGGIS IKPSEGMDEM KYDMCGAAAV 
YGVMRMVAEL QLPINVIGVL AGCENMPGGR AYRPGDVLTT MSGQTVEVLN TDAEGRLVLC 
DVLTYVERFE PEAVIDVATL TGACVIALGH HITGLMANHN PLAHELIAAS EQSGDRAWRL 
PLGDEYQEQL ESNFADMANI GGRPGGAITA GCFLSRFTRK YNWAHLDIAG TAWRSGKAKG 
ATGRPVALLA QFLLNRAGFN GEE