Gene SeHA_C4310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4310
Symbol	pepQ
ID	6488066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	4200065
End bp	4201396
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	642744399
Product	proline dipeptidase
Protein accession	YP_002047993
Protein GI	194449629
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	69
Fosmid unclonability p-value	0.554834
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATCAC TGGCCGCGCT CTATAAAAAT CATATTGTTA CCTTACAAGA ACGGACGCGC 
GATGTTCTGG CGCGCTTTAA GCTGGATGCG TTACTTATTC ATTCCGGCGA GCTTTTCAAC 
GTCTTTCTCG ACGATCACCC TTATCCGTTT AAGGTCAATC CACAGTTTAA AGCGTGGGTG 
CCGGTAACTC AGGTTCCAAA TTGCTGGCTG CTGGTTGATG GCGTCAACAA ACCCAAATTG 
TGGTTTTATC TGCCGGTCGA TTACTGGCAT AACGTTGAAC CGCTGCCAAC ATCCTTCTGG 
ACGGAAGAAG TCGAGGTCGT CGCCTTGCCG AAAGCGGATG GCATCGGCAG CCAGCTGCCT 
GCCGCGCGTG GCAATATCGG CTATATCGGC CCGGTTCCTG AGCGCGCGCT ACAATTGGAT 
ATCGCCGCCA GCAACATCAA CCCGAAAGGT GTTATCGACT ATCTGCATTA CTACCGCGCC 
TATAAAACGG ATTATGAACT GGCCTGTATG CGCGAAGCGC AGAAAATGGC GGTGAGCGGT 
CATCGGGCGG CGGAAGAGGC CTTCCGTTCC GGCATGAGCG AGTTTGACAT CAATCTGGCG 
TACCTGACCG CCACGGGACA TCGCGATACC GATGTTCCGT ACAGCAACAT TGTGGCGCTG 
AACGAACATG CCGCCGTGCT GCATTACACG AAACTGGATC ATCAGGCACC GTCTGAAATG 
CGCAGTTTCC TGCTGGATGC GGGCGCGGAA TACAACGGCT ACGCGGCGGA TCTGACGCGG 
ACCTGGTCGG CGAAAAGCGA TAACGACTAC GCCCACCTGG TGAAAGATGT TAACGACGAA 
CAGTTGGCGC TGATCGCTAC CATGAAGGCG GGCGTCAGCT ATGTGGATTA TCATATTCAG 
TTCCATCAAC GTATCGCGAA GCTGCTGCGT AAACATCAAA TCATTACCGA CATGAGTGAA 
GAGGCGATGG TGGAAAATGA TCTTACCGGG CCGTTTATGC CGCACGGTAT TGGACATCCG 
TTGGGTCTGC AGGTACACGA TGTGGCCGGG TTTATGCAGG ATGATTCCGG TACGCATCTC 
GCTGCACCGT CCAAATACCC GTATCTGCGC TGCACGCGTG TGTTACAGCC GCGAATGGTG 
TTGACCATCG AACCGGGGAT TTACTTCATC GAATCGCTGT TAGCGCCGTG GCGCGAAGGC 
CCGTTCAGCA AGCACTTCAA CTGGCAGAAA ATTGAAGCGC TCAAGCCTTT CGGCGGTATT 
CGCATTGAAG ATAACGTGGT CATCCACGAA AACGGCGTGG AAAACATGAC GCGGGATTTA 
AAACTGGCGT AA

Protein sequence

MESLAALYKN HIVTLQERTR DVLARFKLDA LLIHSGELFN VFLDDHPYPF KVNPQFKAWV 
PVTQVPNCWL LVDGVNKPKL WFYLPVDYWH NVEPLPTSFW TEEVEVVALP KADGIGSQLP 
AARGNIGYIG PVPERALQLD IAASNINPKG VIDYLHYYRA YKTDYELACM REAQKMAVSG 
HRAAEEAFRS GMSEFDINLA YLTATGHRDT DVPYSNIVAL NEHAAVLHYT KLDHQAPSEM 
RSFLLDAGAE YNGYAADLTR TWSAKSDNDY AHLVKDVNDE QLALIATMKA GVSYVDYHIQ 
FHQRIAKLLR KHQIITDMSE EAMVENDLTG PFMPHGIGHP LGLQVHDVAG FMQDDSGTHL 
AAPSKYPYLR CTRVLQPRMV LTIEPGIYFI ESLLAPWREG PFSKHFNWQK IEALKPFGGI 
RIEDNVVIHE NGVENMTRDL KLA