Gene SeSA_A3787 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeSA_A3787
Symbol
ID	6519500
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Schwarzengrund str. CVM19633
Kingdom	Bacteria
Replicon accession	NC_011094
Strand	-
Start bp	3647913
End bp	3649955
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	56%
IMG OID	642748766
Product	oligopeptidase A
Protein accession	YP_002116530
Protein GI	194734493
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATC CATTACTAAC GTCTTTTTCA CTGCCGCCTT TTTCTGCAAT TAAACCGGAG 
CATGTGGTGC CTGCGGTCAC CAAAGCGTTG GCCGATTGCC GGGCGGCGGT AGAAGGCGTT 
GTGGCGCATG GCGCGCCGTA TAGCTGGGAA AACCTCTGCC AGCCGTTGGC GGAAGCCGAC 
GATGTTCTGG GGCGTATTTT CTCGCCAATT AGCCACTTAA ACTCGGTGAA AAATAGCCCG 
GAGCTGCGTG AAGCCTACGA ACAGACGCTG CCGCTGCTGT CGGAATACAG CACTTGGGTT 
GGGCAACATG AAGGACTGTA CAACGCGTAC CGCGACCTGC GCGACGGCGA TCATTACGCC 
ACGCTGAATA CCGCGCAGAA GAAAGCGGTT GATAACGCGC TGCGTGATTT TGAACTGTCC 
GGCATCGGTC TGCCGAAAGA GAAACAGCAG CGTTACGGCG AAATCGCCAC TCGCCTGTCT 
GAGCTGGGCA ACCAGTACAG CAATAATGTG CTCGATGCCA CCATGGGCTG GACGAAGCTC 
ATCACCGACG AAGCCGAGCT GGCGGGAATG CCGGAAAGCG CGCTCGCCGC CGCTAAAGCC 
CAGGCGGAAG CCAAAGAGCA GGAAGGTTAC CTGCTGACCC TGGATATCCC GAGCTATCTG 
CCGGTCATGA CCTACTGCGA CAACCAGGCG TTGCGCGAAG AGATGTATCG CGCCTATTCC 
ACTCGCGCCT CCGACCAGGG GCCGAACGCC GGTAAGTGGG ATAATAGCCC GGTGATGGAA 
GAAATTCTTG CGCTGCGCCA TGAACTGGCG CAACTGCTGG GCTTCGAAAA TTATGCCCAT 
GAATCGCTGG CCACCAAGAT GGCGGAAAAT CCGCAGCAGG TGCTCGATTT CTTAACCGAT 
CTGGCGAAAC GCGCCCGTCC GCAGGGGGAA AAAGAGCTGG CCCAGCTGCG CGCCTTCGCC 
AAAGCCGAAT TTGGCGTTGA GGAGCTGCAA CCGTGGGATA TCGCGTACTA CAGTGAAAAG 
CAAAAACAGC ACCTGTACAG CATCAGCGAT GAGCAGCTAC GCCCGTACTT CCCGGAAAAC 
AAAGCCGTGA ATGGCCTGTT TGAAGTGGTG AAACGTATTT ACGGCATCAC CGCCAAAGAG 
CGTACTGACG TTGATGTCTG GCACCCGGAA GTGCGTTTCT TTGAACTGTA TGACGAAAAT 
AACGAGCTGC GCGGCAGCTT CTACCTTGAC CTGTACGCAC GCGAACACAA ACGCGGCGGG 
GCGTGGATGG ACGACTGTGT CGGCCAGATG CGTAAGGCGG ACGGCACATT GCAAAAGCCG 
GTCGCTTATC TGACCTGTAA CTTCAACCGT CCGGTGAACG GTAAACCCGC TCTGTTTACC 
CATGACGAAG TGATCACCCT GTTCCACGAG TTTGGTCATG GCCTGCATCA TATGCTGACC 
CGCATTGAGA CCGCCGGGGT CTCCGGTATC AGCGGGGTGC CGTGGGACGC GGTCGAACTG 
CCAAGCCAGT TTATGGAAAA CTGGTGCTGG GAGCCGGAAG CGCTGGCGTT TATCTCCGGC 
CACTATGAAA CCGGCGAGCC GTTGCCGAAG GAACTGCTGG ATAAAATGCT GGCGGCGAAA 
AACTATCAGG CGGCGCTGTT TATTCTGCGT CAGCTGGAGT TCGGTCTGTT TGATTTCCGT 
CTGCATGCGG AATTTAATCC GCAGCAAGGA GCGAAAATTC TTGAGACGCT CTTTGAAATT 
AAAAAACAGG TCGCCGTGGT GCCGTCACCG ACATGGGGCC GCTTCCCACA CGCGTTCAGC 
CATATCTTTG CTGGCGGCTA TGCGGCAGGC TACTACAGCT ATCTGTGGGC CGACGTACTG 
GCGGCGGACG CTTATTCCCG CTTTGAGGAG GAAGGCATTT TCAACCGTGA GACCGGTCAG 
TCGTTCCTTG ATAACATCCT GACTCGCGGT GGTTCTGAAG AGCCGATGGA ACTCTTTAAA 
CGCTTCCGTG GCCGTGAACC ACAACTGGAC GCGATGCTGG AGCATTACGG GATTAAAGGC 
TGA

Protein sequence

MTNPLLTSFS LPPFSAIKPE HVVPAVTKAL ADCRAAVEGV VAHGAPYSWE NLCQPLAEAD 
DVLGRIFSPI SHLNSVKNSP ELREAYEQTL PLLSEYSTWV GQHEGLYNAY RDLRDGDHYA 
TLNTAQKKAV DNALRDFELS GIGLPKEKQQ RYGEIATRLS ELGNQYSNNV LDATMGWTKL 
ITDEAELAGM PESALAAAKA QAEAKEQEGY LLTLDIPSYL PVMTYCDNQA LREEMYRAYS 
TRASDQGPNA GKWDNSPVME EILALRHELA QLLGFENYAH ESLATKMAEN PQQVLDFLTD 
LAKRARPQGE KELAQLRAFA KAEFGVEELQ PWDIAYYSEK QKQHLYSISD EQLRPYFPEN 
KAVNGLFEVV KRIYGITAKE RTDVDVWHPE VRFFELYDEN NELRGSFYLD LYAREHKRGG 
AWMDDCVGQM RKADGTLQKP VAYLTCNFNR PVNGKPALFT HDEVITLFHE FGHGLHHMLT 
RIETAGVSGI SGVPWDAVEL PSQFMENWCW EPEALAFISG HYETGEPLPK ELLDKMLAAK 
NYQAALFILR QLEFGLFDFR LHAEFNPQQG AKILETLFEI KKQVAVVPSP TWGRFPHAFS 
HIFAGGYAAG YYSYLWADVL AADAYSRFEE EGIFNRETGQ SFLDNILTRG GSEEPMELFK 
RFRGREPQLD AMLEHYGIKG