Gene SeHA_C3907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C3907
Symbol
ID	6490081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	3777058
End bp	3779100
Gene Length	2043 bp
Protein Length	680 aa
Translation table	11
GC content	56%
IMG OID	642744014
Product	oligopeptidase A
Protein accession	YP_002047620
Protein GI	194449661
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0339] Zn-dependent oligopeptidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	105
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAATC CATTACTAAC GTCTTTTTCA CTGCCGCCTT TTTCTGCAAT TAAACCGGAG 
CATGTGGTGC CTGCGGTCAC CAAAGCGTTG GCCGATTGCC GGGCGGCGGT AGAAGGCGTT 
GTGGCGCATG GCGCGCCGTA TAGCTGGGAA AACCTCTGCC AGCCGTTGGC GGAAGCCGAC 
GATGTTCTGG GGCGTATTTT CTCGCCAATT AGCCACTTAA ACTCGGTGAA AAATAGCCCG 
GAGCTGCGTG AAGCCTACGA ACAGACGCTG CCGCTGTTGT CGGAATACAG CACCTGGGTT 
GGACAGCATG AAGGACTGTA CAACGCGTAC CGCGACCTGC GCGACGGCGA TCATTACGCC 
ACGCTGAATA CCGCGCAGAA GAAAGCGGTT GATAACGCGC TGCGTGATTT TGAACTGTCC 
GGCATCGGTC TGCCGAAAGA GAAACAGCAG CGTTACGGCG AAATCGCCAC TCGCCTGTCT 
GAGCTGGGCA ACCAGTACAG CAATAATGTG CTCGATGCCA CCATGGGCTG GACGAAGCTC 
ATCACCGACG AAGCCGAGCT GGCGGGAATG CCGGAAAGCG CTCTGGCGGC AGCGAAGGCC 
CAGGCGGAAG CCAAAGAGCA GGAAGGTTAC CTGCTGACTC TGGATATCCC GAGCTATCTG 
CCGGTCATGA CCTACTGCGA CAACCAGGCG TTGCGCGAAG AGATGTATCG CGCCTATTCC 
ACTCGCGCCT CCGACCAGGG GCCGAACGCC GGTAAGTGGG ATAACAGCCC GGTGATGGAA 
GAAATTCTTG CGCTGCGCCA TGAACTGGCG CAACTGCTGG GCTTCGAAAA TTATGCCCAT 
GAATCGCTGG CCACCAAAAT GGCGGAAAAT CCGCAGCAGG TGCTCGATTT CTTAACCGAT 
CTGGCGAAAC GCGCCCGTCC GCAGGGGGAA AAAGAGCTGG CCCAGCTGCG CGCCTTCGCC 
AAAGCCGAAT TTGGCGTTGA GGAGCTGCAA CCGTGGGATA TCGCGTACTA CAGTGAAAAG 
CAAAAACAGC ACCTGTACAG CATCAGCGAT GAGCAGCTAC GCCCGTACTT CCCGGAAAAC 
AAAGCCGTGA ATGGCCTGTT TGAAGTGGTG AAACGTATTT ACGGCATCAC CGCCAAAGAG 
CGTACTGACG TTGATGTCTG GCACCCGGAA GTGCGTTTCT TTGAACTGTA TGACGAAAAT 
AACGAGCTGC GCGGCAGCTT CTACCTTGAC CTGTACGCGC GTGAACACAA ACGCGGCGGG 
GCGTGGATGG ACGACTGTGT CGGCCAGATG CGTAAGGCGG ACGGCACATT GCAAAAGCCG 
GTCGCTTATC TGACCTGTAA TTTCAACCGT CCGGTGAACG GTAAACCCGC TCTGTTTACC 
CATGACGAAG TGATCACCCT GTTCCACGAG TTTGGTCATG GCCTGCATCA TATGCTGACC 
CGCATTGAGA CCGCCGGGGT CTCCGGTATC AGCGGCGTGC CGTGGGACGC GGTCGAACTG 
CCAAGTCAGT TTATGGAAAA CTGGTGCTGG GAGCCGGAAG CGCTGGCGTT TATCTCCGGC 
CACTATGAAA CCGGCGAGCC GTTGCCGAAG GAACTGCTGG ATAAAATGCT GGCGGCGAAA 
AACTATCAGG CGGCGCTGTT TATTCTGCGT CAGCTGGAGT TCGGTTTGTT TGATTTCCGT 
CTGCATGCGG AATTTAATCC GCAGCAAGGA GCGAAAATTC TTGAGACGCT CTTTGAAATC 
AAAAAACAGG TCGCCGTGGT GCCGTCACCG ACATGGGGCC GCTTCCCACA TGCGTTCAGC 
CATATCTTTG CTGGCGGCTA TGCGGCAGGC TACTACAGCT ATCTGTGGGC CGACGTACTG 
GCGGCGGACG CTTATTCCCG CTTTGAGGAG GAAGGCATTT TCAACCGTGA GACCGGTCAG 
TCGTTCCTTG ATAACATCCT GACTCGCGGT GGTTCTGAAG AGCCGATGGA ACTCTTTAAA 
CGCTTCCGTG GCCGTGAACC ACAGCTGGAC GCGATGCTGG AGCATTACGG GATTAAAGGC 
TGA

Protein sequence

MTNPLLTSFS LPPFSAIKPE HVVPAVTKAL ADCRAAVEGV VAHGAPYSWE NLCQPLAEAD 
DVLGRIFSPI SHLNSVKNSP ELREAYEQTL PLLSEYSTWV GQHEGLYNAY RDLRDGDHYA 
TLNTAQKKAV DNALRDFELS GIGLPKEKQQ RYGEIATRLS ELGNQYSNNV LDATMGWTKL 
ITDEAELAGM PESALAAAKA QAEAKEQEGY LLTLDIPSYL PVMTYCDNQA LREEMYRAYS 
TRASDQGPNA GKWDNSPVME EILALRHELA QLLGFENYAH ESLATKMAEN PQQVLDFLTD 
LAKRARPQGE KELAQLRAFA KAEFGVEELQ PWDIAYYSEK QKQHLYSISD EQLRPYFPEN 
KAVNGLFEVV KRIYGITAKE RTDVDVWHPE VRFFELYDEN NELRGSFYLD LYAREHKRGG 
AWMDDCVGQM RKADGTLQKP VAYLTCNFNR PVNGKPALFT HDEVITLFHE FGHGLHHMLT 
RIETAGVSGI SGVPWDAVEL PSQFMENWCW EPEALAFISG HYETGEPLPK ELLDKMLAAK 
NYQAALFILR QLEFGLFDFR LHAEFNPQQG AKILETLFEI KKQVAVVPSP TWGRFPHAFS 
HIFAGGYAAG YYSYLWADVL AADAYSRFEE EGIFNRETGQ SFLDNILTRG GSEEPMELFK 
RFRGREPQLD AMLEHYGIKG