Gene SeSA_A4191 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A4191
Symbol	pepQ
ID	6516298
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	+
Start bp	4070071
End bp	4071402
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	53%
IMG OID	642749157
Product	proline dipeptidase
Protein accession	YP_002116909
Protein GI	194734586
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATCAC TGGCCGCGCT CTATAAAAAT CATATTGTTA CCTTACAAGA ACGGACGCGC 
GATGTTCTGG CGCGCTTTAA GCTGGATGCG TTACTTATTC ATTCCGGCGA GCTTTTCAAC 
GTCTTTCTCG ACGATCACCC TTATCCGTTT AAGGTCAATC CACAGTTTAA AGCGTGGGTG 
CCGGTAACTC AGGTTCCAAA TTGCTGGCTG CTGGTCGATG GCGTCAACAA ACCCAAATTG 
TGGTTTTATC TGCCGGTCGA TTACTGGCAT AACGTTGAAC CGCTGCCAAC GTCCTTCTGG 
ACAGAAGAAG TCGAGGTCGT CGCCTTACCG AAAGCGGATG GCATCGGCAG CCAACTGCCT 
GCCGCGCGTG GCAATATCGG CTATATCGGC CCGGTTCCTG AGCGCGCGCT ACAATTGGAT 
ATCGCTGCCA GCAACATCAA CCCGAAAGGT GTTATCGACT ATCTGCATTA CTACCGCGCC 
TATAAAACGG ATTATGAACT GGCCTGTATG CGCGAAGCGC AGAAAATGGC GGTGAGCGGT 
CATCGGGCGG CGGAAGAGGC CTTCCGTTCC GGCATGAGCG AGTTTGACAT CAACCTGGCG 
TACCTGACCG CCACGGGACA TCGCGATACC GATGTTCCGT ACAGCAACAT TGTGGCGCTG 
AACGAACATG CCGCCGTGCT GCATTACACG AAACTGGATC ATCAGGCACC GTCTGAAATG 
CGCAGTTTCC TGCTGGATGC GGGCGCGGAA TACAACGGCT ACGCGGCGGA TCTGACGCGA 
ACCTGGTCGG CGAAAAGCGA TAACGACTAC GCCCACTTGG TGAAAGATGT TAACGACGAA 
CAGTTGGCGC TGATCGCTAC CATGAAGGCG GGCGTCAGCT ATGTGGATTA TCATATTCAG 
TTCCATCAAC GCATCGCGAA GCTGCTGCGT AAACATCAAA TCATTACCGA CATGAGTGAA 
GAGGCGATGG TGGAAAATGA TCTCACCGGG CCGTTTATGC CGCACGGTAT TGGTCATCCG 
TTGGGTCTGC AGGTACACGA TGTGGCCGGG TTTATGCAAG ATGATTCCGG TACGCATCTC 
GCCGCGCCGT CCAAATACCC GTATCTGCGC TGCACGCGTG TGTTACAGCC GCGAATGGTG 
TTGACCATCG AACCGGGGAT TTACTTCATC GAATCGCTGT TAGCGCCGTG GCGCGAAGGG 
CCATTCAGCA AGCACTTCAA CTGGCAGAAA ATTGAAGCGC TCAAGCCTTT CGGCGGTATT 
CGCATTGAAG ATAACGTGGT CATCCACGAA AACGGCGTGG AAAACATGAC GCGGGATTTA 
AAACTGGCGT AA

Protein sequence

MESLAALYKN HIVTLQERTR DVLARFKLDA LLIHSGELFN VFLDDHPYPF KVNPQFKAWV 
PVTQVPNCWL LVDGVNKPKL WFYLPVDYWH NVEPLPTSFW TEEVEVVALP KADGIGSQLP 
AARGNIGYIG PVPERALQLD IAASNINPKG VIDYLHYYRA YKTDYELACM REAQKMAVSG 
HRAAEEAFRS GMSEFDINLA YLTATGHRDT DVPYSNIVAL NEHAAVLHYT KLDHQAPSEM 
RSFLLDAGAE YNGYAADLTR TWSAKSDNDY AHLVKDVNDE QLALIATMKA GVSYVDYHIQ 
FHQRIAKLLR KHQIITDMSE EAMVENDLTG PFMPHGIGHP LGLQVHDVAG FMQDDSGTHL 
AAPSKYPYLR CTRVLQPRMV LTIEPGIYFI ESLLAPWREG PFSKHFNWQK IEALKPFGGI 
RIEDNVVIHE NGVENMTRDL KLA