Gene EcE24377A_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_1033
Symbol	pepN
ID	5586539
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	1056534
End bp	1059146
Gene Length	2613 bp
Protein Length	870 aa
Translation table	11
GC content	54%
IMG OID	640924738
Product	aminopeptidase N
Protein accession	YP_001462152
Protein GI	157155731
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0308] Aminopeptidase N
TIGRFAM ID	[TIGR02414] aminopeptidase N, Escherichia coli type

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.00218696
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTCAAC AGCCACAAGC CAAATACCGT CACGATTATC GTGCGCCGGA TTACCAGATT 
ACTGATATTG ACTTGACCTT TGACCTCGAC GCGCAAAAGA CGGTCGTTAC CGCGGTCAGC 
CAGGCTGTCC GTCATGGTGC ATCAGATGCT CCGCTTCGTC TCAACGGCGA AGACCTCAAA 
CTGGTTTCTG TTCATATTAA TGATGAGCCG TGGACCGCCT GGAAAGAAGA AGAGGGCGCA 
CTGGTCATCA GTAATTTGCC GGAGCGTTTT ACGCTTAAGA TCATTAATGA AATAAGCCCG 
GCGGCGAATA CGGCGCTGGA AGGGCTTTAT CAGTCAGGCG ATGCGCTTTG CACCCAGTGT 
GAAGCCGAAG GTTTCCGCCA TATTACGTAT TATCTCGACC GCCCGGACGT GCTGGCGCGT 
TTTACCACCA AAATTATTGC CGATAAAACC AAATATCCCT TCCTGCTTTC CAACGGTAAC 
CGCGTTGCGC AAGGTGAACT GGAAAACGGA CGCCATTGGG TACAGTGGCA GGACCCGTTC 
CCGAAACCGT GCTACCTGTT TGCGCTGGTG GCAGGCGACT TTGATGTACT GCGCGACACC 
TTTACCACGC GTTCTGGTCG CGAAGTGGCG CTGGAGCTGT ACGTCGATCG CGGCAACCTT 
GATCGCGCGC CGTGGGCGAT GACCTCGCTG AAAAACTCAA TGAAATGGGA TGAAGAACGC 
TTCGGCCTGG AGTATGACCT CGACATCTAT ATGATCGTCG CGGTGGATTT CTTCAATATG 
GGCGCAATGG AGAATAAGGG TTTGAATATC TTTAACTCCA AATATGTGCT GGCCCGCACC 
GACACCGCCA CTGACAAAGA TTACCTCGAT ATTGAACGCG TTATCGGCCA TGAATATTTC 
CATAACTGGA CCGGTAACCG AGTCACCTGC CGCGACTGGT TCCAGCTCAG CCTGAAAGAA 
GGTTTAACCG TCTTCCGCGA TCAGGAATTC AGCTCTGACC TTGGTTCCCG CGCGGTAAAC 
CGTATCAATA ATGTGCGCAC CATGCGCGGA TTGCAGTTTG CGGAAGACGC CAGCCCGATG 
GCGCACCCGA TCCGCCCGGA TATGGTCATT GAGATGAACA ACTTCTACAC CCTGACCGTT 
TACGAGAAGG GCGCGGAAGT GATTCGCATG ATCCACACCC TGCTGGGCGA AGAAAACTTC 
CAGAAAGGGA TGCAACTCTA TTTCGAGCGC CATGATGGCA GCGCGGCAAC CTGCGACGAC 
TTTGTGCAGG CGATGGAAGA TGCGTCGAAT GTCGATCTCT CCCATTTCCG CCGTTGGTAC 
AGCCAGTCCG GCACGCCGAT TGTGACCGTC AAAGACGACT ACAATCCGGA AACCGAGCAG 
TACACCCTGA CCATCAGCCA GCGCACGCCA GCCACGCCGG ATCAGGCAGA AAAACAGCCG 
CTGCATATTC CATTTGCCAT CGAATTGTAT GACAACGAAG GCAAAGTGAT CCCGTTGCAG 
AAAGGCGGTC ATCCGGTGAA TTCCGTGCTG AACGTCACCC AGGCGGAACA GACCTTTGTT 
TTTGATAATG TCTACTTCCA GCCGGTGCCT GCGCTGCTAT GCGAATTCTC TGCGCCAGTG 
AAACTGGAAT ATAAGTGGAG CGATCAGCAA CTGACCTTCC TGATGCGTCA TGCGCGTAAT 
GATTTCTCCC GTTGGGATGC GGCGCAAAGT TTGCTGGCAA CCTACATCAA GCTGAACGTC 
GCCCGTCATC AGCAAGGGCA GCCGCTGTCT CTGCCGGTAC ATGTGGCTGA CGCTTTCCGC 
GCGGTGCTGC TCGATGAGAA GATTGATCCG GCGCTGGCGG CAGAAATCCT GACGCTGCCT 
TCTGTCAATG AAATGGCTGA ACTGTTCGAT ATCATCGACC CGATTGCTAT TGCCGAAGTA 
CGCGAAGCAC TCACTCGTAC TCTGGCGACT GAACTGGCGG ATGAGCTGCT GGCTATTTAC 
AACGCGAATT ACCAGAGCGA GTACCGTGTT GAGCATGAAG ATATTGCAAA ACGCACTCTG 
CGTAATGCCT GCCTGCGCTT CCTTGCTTTT GGTGAAACGC ATCTGGCTGA CGTGCTGGTG 
AGCAAGCAAT ACCATGAAGC AAACAATATG ACCGATGCGC TGGCAGCGCT TTCTGCGGCG 
GTTGCTGCAC AGCTGCCTTG CCGTGACGCG CTGATGCAGG AGTACGACGA TAAGTGGCAT 
CAGGACGGTC TGGTGATGGA TAAATGGTTT ATCCTGCAAG CCACCAGCCC GGCGGCGAAT 
GTGCTGGAGA CGGTGCGTGG TCTGTTGCAG CATCGCTCAT TTACCATGAG CAACCCGAAC 
CGTATTCGTT CGTTGATTGG TGCGTTTGCG GGCAGCAACC CGGCAGCGTT CCATGCCGAA 
GATGGCAGCG GTTACCAGTT CCTGGTGGAA ATGCTTACCG ACCTCAACAG CCGTAACCCG 
CAGGTAGCTT CACGTCTGAT TGAACCGCTG ATTCGCCTGA AACGTTATGA TGCCAAACGT 
CAGGAGAAAA TGCGCGCGGC GCTGGAACAG TTGAAAGGGC TGGAAAATCT CTCTGGCGAT 
CTGTACGAGA AGATCACCAA AGCACTGGCT TGA

Protein sequence

MTQQPQAKYR HDYRAPDYQI TDIDLTFDLD AQKTVVTAVS QAVRHGASDA PLRLNGEDLK 
LVSVHINDEP WTAWKEEEGA LVISNLPERF TLKIINEISP AANTALEGLY QSGDALCTQC 
EAEGFRHITY YLDRPDVLAR FTTKIIADKT KYPFLLSNGN RVAQGELENG RHWVQWQDPF 
PKPCYLFALV AGDFDVLRDT FTTRSGREVA LELYVDRGNL DRAPWAMTSL KNSMKWDEER 
FGLEYDLDIY MIVAVDFFNM GAMENKGLNI FNSKYVLART DTATDKDYLD IERVIGHEYF 
HNWTGNRVTC RDWFQLSLKE GLTVFRDQEF SSDLGSRAVN RINNVRTMRG LQFAEDASPM 
AHPIRPDMVI EMNNFYTLTV YEKGAEVIRM IHTLLGEENF QKGMQLYFER HDGSAATCDD 
FVQAMEDASN VDLSHFRRWY SQSGTPIVTV KDDYNPETEQ YTLTISQRTP ATPDQAEKQP 
LHIPFAIELY DNEGKVIPLQ KGGHPVNSVL NVTQAEQTFV FDNVYFQPVP ALLCEFSAPV 
KLEYKWSDQQ LTFLMRHARN DFSRWDAAQS LLATYIKLNV ARHQQGQPLS LPVHVADAFR 
AVLLDEKIDP ALAAEILTLP SVNEMAELFD IIDPIAIAEV REALTRTLAT ELADELLAIY 
NANYQSEYRV EHEDIAKRTL RNACLRFLAF GETHLADVLV SKQYHEANNM TDALAALSAA 
VAAQLPCRDA LMQEYDDKWH QDGLVMDKWF ILQATSPAAN VLETVRGLLQ HRSFTMSNPN 
RIRSLIGAFA GSNPAAFHAE DGSGYQFLVE MLTDLNSRNP QVASRLIEPL IRLKRYDAKR 
QEKMRAALEQ LKGLENLSGD LYEKITKALA