Gene SNSL254_A3864 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3864
Symbol
ID	6483445
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3738499
End bp	3740541
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	56%
IMG OID	642739129
Product	oligopeptidase A
Protein accession	YP_002042840
Protein GI	194446166
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	92
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATC CATTACTAAC GTCTTTTTCA CTGCCGCCTT TTTCTGCAAT TAAACCGGAG 
CATGTGGTGC CTGCGGTCAC CAAAGCGTTG GCCGATTGCC GGGCGGCGGT AGACGGCGTT 
GTGGCGCATG GCGCGCCGTA TAGCTGGGAA AACCTTTGCC AGCCGTTGGC GGAAGCCGAC 
GATGTTCTGG GGCGTATTTT CTCGCCAATT AGCCACTTAA ACTCGGTGAA AAATAGCCCG 
GAGCTGCGTG AAGCCTACGA ACAGACGCTG CCGCTGCTGT CGGAATACAG CACCTGGGTT 
GGCCAGCATG AAGGGTTGTA CAACGCGTAC CGCGACCTGC GCGACGGCGA TCATTACGCC 
ACTCTGAATA CCGCGCAGAA GAAAGCGGTT GATAACGCGC TACGTGATTT TGAACTGTCC 
GGCATCGGCC TGCCGAAAGA GAAACAGCAG CGTTACGGTG AAATCGCCAC TCGCCTGTCT 
GAGCTGGGCA ACCAGTACAG CAACAACGTG CTCGATGCCA CCATGGGCTG GACGAAGCTC 
ATCACCGACG AAGCCGAGCT GGCGGGAATG CCGGAAAGCG CTCTGGCGGC AGCAAAGGCC 
CAGGCGGAAG CCAAAGAGCA GGAAGGTTAC CTGCTGACTC TGGATATCCC GAGCTATCTG 
CCGGTCATGA CCTACTGCGA CAACCAGGCG TTGCGCGAAG AGATGTATCG CGCCTATTCC 
ACTCGCGCCT CCGACCAGGG GCCGAACGCC GGTAAGTGGG ATAACAGCCC GGTGATGGAA 
GAAATTCTTG CGCTGCGCCA TGAACTGGCG CAACTGCTGG GCTTCGAAAA TTATGCCCAT 
GAATCGCTGG CCACCAAAAT GGCGGAAAAT CCGCAGCAGG TGCTCGATTT CTTAACCGAT 
CTGGCGAAAC GCGCCCGTCC GCAGGGGGAA AAAGAGCTGG CCCAGCTGCG CGCCTTCGCC 
AAAGCCGAAT TTGGCGTTGA GGAACTGCAA CCGTGGGATA TCGCGTACTA CAGTGAAAAG 
CAAAAACAGC ACCTGTACAG CATCAGCGAT GAGCAGCTAC GTCCGTACTT CCCGGAAAAC 
AAAGCCGTGA ATGGCCTGTT TGAAGTGGTG AAACGTATTT ACGGCATCAC TGCCAAAGAG 
CGTACTGACG TTGATGTCTG GCACCCGGAA GTGCGTTTCT TTGAACTGTA TGACGAAAAT 
AACGAGCTGC GCGGAAGCTT CTACCTTGAC CTGTACGCGC GTGAACACAA ACGCGGCGGG 
GCGTGGATGG ACGACTGTGT CGGCCAGATG CGTAAGGCGG ACGGCACATT GCAAAAGCCG 
GTCGCTTATC TGACCTGTAA TTTCAACCGT CCGGTGAACG GTAAACCCGC TCTGTTTACC 
CATGACGAAG TGATCACCCT GTTCCACGAG TTTGGTCATG GCTTGCATCA TATGTTGACC 
CGCATTGAGA CCGCCGGGGT CTCCGGTATC AGCGGGGTGC CGTGGGATGC GGTCGAACTG 
CCGAGCCAGT TTATGGAAAA CTGGTGCTGG GAGCCGGAAG CGCTGGCGTT TATCTCCGGC 
CACTATGAAA CCGGCGAGCC GTTGCCGAAG GAACTGCTGG ATAAAATGCT GGCGGCGAAA 
AACTATCAGG CGGCGCTGTT TATTCTGCGT CAACTGGAGT TCGGTCTGTT TGATTTCCGT 
CTGCATGCGG AATTTAACCC GCAGCAAGGG GCGAAAATTC TTGAGACGCT CTTTGAAATC 
AAAAAACAGG TCGCCGTGGT GCCGTCACCG ACATGGGGCC GTTTCCCACA TGCGTTCAGC 
CATATCTTTG CTGGCGGCTA TGCGGCAGGC TACTACAGCT ATCTGTGGGC CGACGTACTG 
GCGGCGGACG CTTATTCCCG CTTTGAGGAG GAAGGCATTT TCAACCGTGA GACCGGTCAG 
TCGTTCCTTG ATAACATCCT GACTCGCGGT GGTTCTGAAG AGCCGATGGA ACTCTTTAAA 
CGCTTCCGTG GCCGTGAGCC ACAGCTGGAC GCGATGCTGG AGCATTACGG GATTAAAGGC 
TGA

Protein sequence

MTNPLLTSFS LPPFSAIKPE HVVPAVTKAL ADCRAAVDGV VAHGAPYSWE NLCQPLAEAD 
DVLGRIFSPI SHLNSVKNSP ELREAYEQTL PLLSEYSTWV GQHEGLYNAY RDLRDGDHYA 
TLNTAQKKAV DNALRDFELS GIGLPKEKQQ RYGEIATRLS ELGNQYSNNV LDATMGWTKL 
ITDEAELAGM PESALAAAKA QAEAKEQEGY LLTLDIPSYL PVMTYCDNQA LREEMYRAYS 
TRASDQGPNA GKWDNSPVME EILALRHELA QLLGFENYAH ESLATKMAEN PQQVLDFLTD 
LAKRARPQGE KELAQLRAFA KAEFGVEELQ PWDIAYYSEK QKQHLYSISD EQLRPYFPEN 
KAVNGLFEVV KRIYGITAKE RTDVDVWHPE VRFFELYDEN NELRGSFYLD LYAREHKRGG 
AWMDDCVGQM RKADGTLQKP VAYLTCNFNR PVNGKPALFT HDEVITLFHE FGHGLHHMLT 
RIETAGVSGI SGVPWDAVEL PSQFMENWCW EPEALAFISG HYETGEPLPK ELLDKMLAAK 
NYQAALFILR QLEFGLFDFR LHAEFNPQQG AKILETLFEI KKQVAVVPSP TWGRFPHAFS 
HIFAGGYAAG YYSYLWADVL AADAYSRFEE EGIFNRETGQ SFLDNILTRG GSEEPMELFK 
RFRGREPQLD AMLEHYGIKG