Gene SeD_A3968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3968
Symbol
ID	6875574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3803715
End bp	3805757
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	56%
IMG OID	642786925
Product	oligopeptidase A
Protein accession	YP_002217553
Protein GI	198246092
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	82
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATC CATTACTAAC GTCTTTTTCA CTGCCGCCTT TTTCTGCAAT TAAACCGGAG 
CATGTGGTGC CTGCGGTCAC CAAAGCGTTG GCCGATTGCC GGGCGGCGGT AGAAGGCGTT 
GTGGCGCATG GCGCGCCGTA TAGCTGGGAA AACCTCTGCC AGCCGTTGGC GGAAGCCGAC 
GATGTTCTGG GGCGTATTTT CTCGCCAATT AGCCACTTAA ACTCGGTGAA AAATAGTCCG 
GAGCTGCGTG AAGCCTACGA ACAGACGCTG CCGCTGCTGT CGGAATACAG CACCTGGGTT 
GGCCAGCATG AAGGGTTGTA CAACGCGTAC CGCGACCTGC GCGACGGCGA TCATTACGCC 
ACTCTGAATA CCGCGCAGAA GAAAGCGGTT GATAACGCGC TGCGTGATTT TGAACTGTCC 
GGCATCGGCC TGCCGAAAGA GAAACAGCAG CGTTACGGCG AAATCGCCAC TCGCCTGTCT 
GAGCTGGGCA ACCAGTACAG CAATAATGTG CTCGATGCCA CTATGGGCTG GACGAAGCTC 
ATCACCGATG AAGCCGAGCT GGCGGGAATG CCGGAAAGCG CTCTGGCGGC AGCTAAAGCC 
CAGGCGGAAG CCAAAGAGCA GGAAGGTTAC CTGCTGACTC TGGATATCCC GAGCTATCTG 
CCAGTGATGA CCTACTGCGA CAACCAGGCG TTGCGTGAAG AGATGTATCG CGCCTATTCC 
ACTCGCGCCT CCGACCAGGG GCCGAACGCC GGTAAGTGGG ATAACAGCCC GGTGATGGAA 
GAAATTCTTG CGCTGCGCCA TGAACTGGCG CAACTGCTGG GCTTCGAAAA TTATGCCCAT 
GAGTCACTGG CCACCAAGAT GGCGGAAAAT CCGCAGCAGG TGCTCGATTT CTTAACCGAT 
CTGGCGAAAC GCGCCCGTCC GCAGGGGGAA AAAGAGCTGG CCCAGCTGCG CGCCTTCGCC 
AAAGCCGAAT TTGGCGTTGA GGAACTGCAA CCGTGGGATA TCGCGTACTA CAGTGAAAAG 
CAAAAACAGC ACCTGTACAG CATCAGCGAT GAGCAGCTAC GTCCGTACTT CCCGGAAAAC 
AAAGCCGTGA ATGGCCTGTT TGAAGTGGTG AAACGTATTT ACGGCATCAC TGCCAAAGAG 
CGTACTGACG TTGATGTCTG GCACCCGGAA GTGCGTTTCT TTGAACTGTA TGACGAAAAT 
AACGAGCTGC GCGGCAGCTT CTACCTTGAC CTGTACGCGC GCGAACACAA ACGCGGCGGG 
GCGTGGATGG ACGACTGTGT CGGCCAGATG CGTAAGGCGG ACGGCACATT GCAAAAGCCG 
GTCGCTTATC TGACCTGTAA TTTCAACCGT CCGGTGAACG GTAAACCCGC TCTGTTTACC 
CATGACGAAG TGATCACCCT GTTCCACGAG TTTGGTCATG GCCTGCATCA TATGCTGACC 
CGCATTGAGA CCGCCGGGGT CTCCGGTATC AGCGGCGTGC CGTGGGACGC GGTCGAACTG 
CCAAGCCAGT TTATGGAAAA CTGGTGCTGG GAGCCGGAAG CGCTGGCGTT TATCTCCGGC 
CACTATGAGA CCGGCGAACC GCTGCCGAAG GAACTGCTGG ATAAAATGCT GGCGGCGAAA 
AACTATCAGG CGGCGCTGTT TATTCTGCGT CAACTGGAGT TCGGTCTGTT TGATTTCCGT 
CTGCATGCGG AATTTAACCC GCAGCAAGGA GCGAAAATTC TTGAGACGCT CTTTGAAATT 
AAAAAACAGG TCGCCGTGGT GCCGTCACCG ACATGGGGCC GCTTCCCACA TGCATTCAGC 
CATATCTTTG CTGGCGGCTA TGCGGCAGGC TACTACAGCT ATCTGTGGGC CGACGTACTG 
GCGGCGGACG CTTATTCCCG CTTTGAGGAG GAAGGCATTT TCAACCGTGA GACCGGTCAG 
TCGTTCCTTG ATAACATCCT GACTCGTGGT GGTTCTGAAG AGCCGATGGA ACTCTTTAAA 
CGCTTCCGTG GCCGTGAACC ACAGCTGGAC GCGATGCTGG AGCATTACGG GATTAAAGGC 
TGA

Protein sequence

MTNPLLTSFS LPPFSAIKPE HVVPAVTKAL ADCRAAVEGV VAHGAPYSWE NLCQPLAEAD 
DVLGRIFSPI SHLNSVKNSP ELREAYEQTL PLLSEYSTWV GQHEGLYNAY RDLRDGDHYA 
TLNTAQKKAV DNALRDFELS GIGLPKEKQQ RYGEIATRLS ELGNQYSNNV LDATMGWTKL 
ITDEAELAGM PESALAAAKA QAEAKEQEGY LLTLDIPSYL PVMTYCDNQA LREEMYRAYS 
TRASDQGPNA GKWDNSPVME EILALRHELA QLLGFENYAH ESLATKMAEN PQQVLDFLTD 
LAKRARPQGE KELAQLRAFA KAEFGVEELQ PWDIAYYSEK QKQHLYSISD EQLRPYFPEN 
KAVNGLFEVV KRIYGITAKE RTDVDVWHPE VRFFELYDEN NELRGSFYLD LYAREHKRGG 
AWMDDCVGQM RKADGTLQKP VAYLTCNFNR PVNGKPALFT HDEVITLFHE FGHGLHHMLT 
RIETAGVSGI SGVPWDAVEL PSQFMENWCW EPEALAFISG HYETGEPLPK ELLDKMLAAK 
NYQAALFILR QLEFGLFDFR LHAEFNPQQG AKILETLFEI KKQVAVVPSP TWGRFPHAFS 
HIFAGGYAAG YYSYLWADVL AADAYSRFEE EGIFNRETGQ SFLDNILTRG GSEEPMELFK 
RFRGREPQLD AMLEHYGIKG