Gene SeHA_C4882 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4882
Symbol	pepA
ID	6491944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4752169
End bp	4753680
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	58%
IMG OID	642744928
Product	leucyl aminopeptidase
Protein accession	YP_002048501
Protein GI	194449974
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.417344
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	89
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTTCA GTGTAAAAAG CGGTAGCCCG GAGAAACAGC GGAGTGCCTG CATTGTCGTG 
GGCGTCTTTG AACCGCGTCG CCTTTCTCCG ATTGCAGAAC AGCTCGACAA AATTAGCGAC 
GGATACATCA GCGCATTGCT GCGTCGCGGC GAACTGGAAG GAAAACCGGG GCAGACTCTG 
TTGCTGCACC ATGTTCCTAA CGTTCTTTCC GAGCGAATCC TCCTCATTGG TTGCGGCAAA 
GAGCGCGAGC TTGATGAACG TCAGTATAAG CAGGTTATTC AGAAAACGAT AAATACTCTG 
AATGATACTG GTTCGATGGA AGCCGTCTGT TTCCTGACCG AACTGCACGT TAAAGGCCGC 
AACAACTACT GGAAAGTGCG TCAGGCCGTC GAAACGGCCA AAGAGACGCT TTATAGCTTT 
GATCAACTCA AGACCAACAA GAGCGAGCCG CGCCGCCCGC TACGTAAGAT GGTCTTTAAT 
GTGCCGACCC GCCGTGAGCT CACCAGCGGC GAACGCGCCA TTCAGCACGG TCTGGCCATC 
GCCGCCGGGA TTAAGGCTGC GAAAGATCTC GGCAACATGC CGCCCAATAT CTGTAACGCC 
GCCTACCTGG CGTCACAGGC GCGCCAGTTG GCCGACAGCT ACAGCAAAAA TGTCATCACC 
CGCGTGATCG GCGAACAGCA AATGCGCGAA CTGGGTATGA ACGCTTATCT GGCGGTCGGC 
CACGGTTCGC AGAATGAATC GCTGATGTCG GTGATTGAGT ACAAGGGCAA TCCGTCCGAA 
GACGCGCGTC CGATCGTGCT GGTGGGTAAG GGCCTGACCT TCGACTCCGG CGGCATCTCC 
ATCAAGCCAT CTGAAGGGAT GGACGAGATG AAGTACGACA TGTGCGGCGC GGCGGCGGTT 
TACGGCGTGA TGCGTATGGT CGCCGAGCTT CAGCTACCGA TTAACGTTAT CGGCGTACTG 
GCGGGCTGTG AAAACATGCC GGGCGGACGC GCGTATCGTC CGGGCGACGT ACTGACCACC 
ATGTCCGGTC AGACGGTTGA AGTGCTGAAT ACCGATGCTG AAGGCCGTCT GGTACTGTGC 
GACGTGCTGA CCTACGTTGA GCGCTTCGAA CCGGAAGCCG TCATTGACGT CGCGACGCTA 
ACCGGCGCCT GCGTGATTGC GCTGGGCCAT CACATTACCG GTCTGATGTC GAACCATAAC 
CCGCTGGCGC ATGAACTGAT CGGCGCGTCC GAGCAAGCGG GCGACCGCGC GTGGCGTCTG 
CCGCTGGGCG ATGAGTTCCA GGAACAACTG GAGTCCAACT TTGCGGATAT GGCGAACATT 
GGTGGTCGTC CTGGCGGCGC TATCACCGCG GGCTGCTTCC TGTCGCGCTT TACCCGTAAG 
TACAACTGGG CGCACCTGGA TATCGCCGGT ACCGCCTGGC GTTCCGGCAA AGCGAAAGGC 
GCGACGGGTC GTCCGGTAGC GCTGCTGTCG CAGTTCCTGC TCAATCGTGC GGGCTTTAAC 
GGCGAAGAGT AA

Protein sequence

MEFSVKSGSP EKQRSACIVV GVFEPRRLSP IAEQLDKISD GYISALLRRG ELEGKPGQTL 
LLHHVPNVLS ERILLIGCGK ERELDERQYK QVIQKTINTL NDTGSMEAVC FLTELHVKGR 
NNYWKVRQAV ETAKETLYSF DQLKTNKSEP RRPLRKMVFN VPTRRELTSG ERAIQHGLAI 
AAGIKAAKDL GNMPPNICNA AYLASQARQL ADSYSKNVIT RVIGEQQMRE LGMNAYLAVG 
HGSQNESLMS VIEYKGNPSE DARPIVLVGK GLTFDSGGIS IKPSEGMDEM KYDMCGAAAV 
YGVMRMVAEL QLPINVIGVL AGCENMPGGR AYRPGDVLTT MSGQTVEVLN TDAEGRLVLC 
DVLTYVERFE PEAVIDVATL TGACVIALGH HITGLMSNHN PLAHELIGAS EQAGDRAWRL 
PLGDEFQEQL ESNFADMANI GGRPGGAITA GCFLSRFTRK YNWAHLDIAG TAWRSGKAKG 
ATGRPVALLS QFLLNRAGFN GEE