Gene SeD_A4370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A4370
Symbol	pepQ
ID	6874557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	4218687
End bp	4220018
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	642787294
Product	proline dipeptidase
Protein accession	YP_002217910
Protein GI	198242585
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	72
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATCAC TGGCCGCGCT CTATAAAAAT CATATTGTTA CCTTACAAGA ACGGACGCGC 
GATGTTCTGG CGCGCTTTAA GCTGGATGCG TTACTTATTC ATTCCGGCGA GCTTTTCAAC 
GTCTTTCTCG ACGATCACCC TTATCCGTTT AAGGTCAATC CGCAGTTTAA AGCGTGGGTG 
CCGGTAACTC AGGTTCCAAA TTGCTGGCTG CTGGTCGATG GCGTCAACAA ACCCAAATTG 
TGGTTTTATC TGCCGGTCGA TTACTGGCAT AACGTTGAAC CGCTGCCAAC GTCATTCTGG 
ACAGAAGAAG TCGAGGTCGT CGCCTTACCG AAAGCGGATG GCATCGGCAG CCAACTGCCT 
GCCGCGCGTG GCAATATCGG CTATATCGGC CCGGTTCCTG AGCGCGCGCT ACAATTGGAT 
ATCGCCGCCA GCAACATCAA CCCGAAAGGT GTTATCGACT ATCTGCATTA CTACCGCGCC 
TATAAAACGG ATTATGAACT GGCCTGTATG CGCGAAGCGC AGAAAATGGC GGTGAGCGGT 
CATCGGGCGG CGGAAGAGGC CTTCCGTTCC GGCATGAGTG AGTTCGACAT CAACCTGGCG 
TACCTGACCG CCACGGGACA TCGCGATACT GATGTTCCAT ACAGCAACAT TGTGGCGCTG 
AACGAACATG CCGCCGTGCT GCATTACACG AAACTGGATC ATCAGGCACC GTCTGAAATG 
CGCAGTTTCC TGCTGGATGC GGGCGCGGAA TACAATGGCT ACGCGGCGGA TCTGACGCGG 
ACCTGGTCGG CGAAAAGCGA TAACGACTAC GCCCACCTGG TGAAAGATGT TAACGACGAA 
CAGTTGGCGC TGATCGCTAC CATGAAGGCG GGCGTCAGCT ATGTGGATTA TCATATTCAG 
TTCCATCAAC GTATCGCGAA GCTGCTGCGT AAACATCAAA TCATTACCGA CATGAGTGAA 
GAGGCGATGG TGGAAAATGA TCTTACCGGG CCGTTTATGC CGCACGGTAT TGGTCATCCG 
TTGGGTCTGC AGGTACACGA TGTGGCCGGG TTTATGCAGG ATGATTCCGG TACGCATCTC 
GCTGCACCGT CCAAATACCC GTATCTGCGC TGCACGCGTG TGTTACAGCC GCGAATGGTG 
TTGACCATCG AACCGGGGAT TTACTTCATC GAATCGCTGT TAGCGCCGTG GCGCGAAGGC 
CCGTTCAGCA AGCACTTCAA CTGGCAGAAA ATTGAAGCGC TCAAGCCTTT CGGCGGTATT 
CGCATTGAAG ATAACGTGGT CATCCACGAA AACGGCGTGG AAAACATGAC GCGGGATTTA 
AAACTGGCGT AA

Protein sequence

MESLAALYKN HIVTLQERTR DVLARFKLDA LLIHSGELFN VFLDDHPYPF KVNPQFKAWV 
PVTQVPNCWL LVDGVNKPKL WFYLPVDYWH NVEPLPTSFW TEEVEVVALP KADGIGSQLP 
AARGNIGYIG PVPERALQLD IAASNINPKG VIDYLHYYRA YKTDYELACM REAQKMAVSG 
HRAAEEAFRS GMSEFDINLA YLTATGHRDT DVPYSNIVAL NEHAAVLHYT KLDHQAPSEM 
RSFLLDAGAE YNGYAADLTR TWSAKSDNDY AHLVKDVNDE QLALIATMKA GVSYVDYHIQ 
FHQRIAKLLR KHQIITDMSE EAMVENDLTG PFMPHGIGHP LGLQVHDVAG FMQDDSGTHL 
AAPSKYPYLR CTRVLQPRMV LTIEPGIYFI ESLLAPWREG PFSKHFNWQK IEALKPFGGI 
RIEDNVVIHE NGVENMTRDL KLA