Gene SeD_A1825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1825
Symbol
ID	6871091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	1767330
End bp	1768412
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	53%
IMG OID	642784957
Product	peptidyl-dipeptidase dcp
Protein accession	YP_002215625
Protein GI	198243512
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.425025
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	93
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACGA ATCCTTTGTT AGACCAGAGT ATGTTGCCCT ATCAGGCACC GCGTTTTGAT 
CGGATCAAAG ATTGCCATTA TCGTCCTGCT TTTGATGAGG GCGTTCGGCA AAAACGCGTG 
GAAATCGAGG CCATCGTCAA TCATCCGGCG GCCCCTGACT TTACGAATAC GCTTCTGGCG 
CTGGAGCAAA GCGGGGCGCT TCTGTCACGC GTCACCAGCA TTTTTTTCGC GATGACGGCC 
GCGCACACTA ACGATGAACT CCAGCGGTTG GATGAGGCCT TTTCTGCCGA GCTGGCGGCG 
CTCTCCAACG ATATTTATCT GAATAGCGCG TTATTCGCTC GCGTGGATGC CGTCTGGCAA 
CAGCGTCACT CACTGGGGCT GGATGATGAG TCGCTACGGT TGGTCGATGT GATCCATCAG 
CGTTTTGTGT TGGCAGGCGC GCAGCTTGCC GAAGAGGATA AAGCGCAACT GAAGGTATTG 
AATACTGAAT CCGCGACCTT AATGAGTCAG TTTAATCAGC GTCTGCTGGC GGCAAGTAAA 
GCGGGCGGGC TGGCGGTCGA TGACGCGCAT TGCCTGGCAG GATTAAGCCC GGAAGAAATG 
ACCGTCGCTG CTGAAGCGGC GCGTGAAAAA GGCCTGGAGG AGCGCTGGTT CATTCCGCTC 
CTTAATACGA CGCAACAGCC TGCGCTTGCT ACGCTGCGCG ATCGCCAGAC TCGCGAAAAT 
TTATTCGCAG CGTCATGGAC TCGGGCGGAA AAAGGAGATG CCCACGATAC CCGCGCTATC 
GTTCAGCGTC TGGTAGAGAT TCGTCGCTGT CAGGCAAAAC TGCTGGGTTT CCCCAATTAT 
GCCGCATGGA AAATGGCCGA TCAGATGGCG AAAACGCCGC AAGCCGCACT GAGCTTTATG 
CGTGGCATTG TGCCGCCAGC GCGTCAGCGT GTACTCAATG AACAGGCGGA AATTCAGAAC 
GTCATATTTA TGGGGTTAAA TTGTCTGAAT ATAAAGAGGG CGTGCATTCG GATTTTTCTA 
CTTATTTTCC CGTGGTGGCT TGATTGCCAA AGATTTATTA CCGCTTCGCT GCTGATGTTT 
TAA

Protein sequence

MSTNPLLDQS MLPYQAPRFD RIKDCHYRPA FDEGVRQKRV EIEAIVNHPA APDFTNTLLA 
LEQSGALLSR VTSIFFAMTA AHTNDELQRL DEAFSAELAA LSNDIYLNSA LFARVDAVWQ 
QRHSLGLDDE SLRLVDVIHQ RFVLAGAQLA EEDKAQLKVL NTESATLMSQ FNQRLLAASK 
AGGLAVDDAH CLAGLSPEEM TVAAEAAREK GLEERWFIPL LNTTQQPALA TLRDRQTREN 
LFAASWTRAE KGDAHDTRAI VQRLVEIRRC QAKLLGFPNY AAWKMADQMA KTPQAALSFM 
RGIVPPARQR VLNEQAEIQN VIFMGLNCLN IKRACIRIFL LIFPWWLDCQ RFITASLLMF