Gene SeAg_B1026 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B1026
Symbol
ID	6793995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	1028045
End bp	1029805
Gene Length	1761 bp
Protein Length	586 aa
Translation table	11
GC content	54%
IMG OID	642775296
Product	lon protease (S16) proteolytic domain protein
Protein accession	YP_002145938
Protein GI	197250157
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1067] Predicted ATP-dependent protease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000023789
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGACCATTA CGAAACTTGC ATGGCGTGAT CTGGTTCCGG ATAGCGAAAG CTATCAGGAG 
ATATTTGCAC AGCCACACGC GACTGACGAA AACGACACCT TACTCAGTGA TACTCAGCCA 
CGACTGCAAT TTGCGCTTGA GCAACTTATA CAGCCGTGGG CATCATCCTC TTTTATGCTG 
ACTAAAGCGC CTGAAGAGCA AGAGTATCTC ACTTTACTTT CAGATGCCGT CCGCGCTCTG 
CAAACCGATG CCGGACAATT AACCGGCGGA CATTATGACG TTTCCGGGCA TACTGTTCAT 
TACCGCGCCG CGCAGAATGC GCAAGACAAC TTTGCCACCG TCACACAAGT CGTCAGCGCG 
GACTGGGTCG AAGCCGAACA GCTCTTTGGT TGCCTGCGGC AGTATAACGG CGACATTATC 
CTGCAGCCGG GACTGGTTCA TCAGGCGAAC GGCGGCGTGC TGATTATTTC CTTACGAACC 
CTTCTGGCGC AGCCGTTACT GTGGATGCGT CTGAAAGCCA TCGTTAGCCG CGAGCGTTTT 
GACTGGGTGG CCTTTGACGA GTCGCGTCCA TTACCGGTCT CCGTGCCATC CATGCCGCTC 
AAACTGAAGG TGATTCTGGT TGGCGAACGT GAATCACTGG CTGATTTTCA GGAGATGGAA 
CCGGAGCTCG CGGAACAGGC TATCTACAGT GAATTTGAAG ACAATTTACA GATAGCGGAC 
GCAGAAGCTA TGACCCTGTG GTGTCAATGG GTGACGCGTA TCGCTTTACG CGATAATTTG 
CCGCCCCCGG CACCGGACGC CTGGCCCGTC CTGATACGCG AGGCTGTGCG CTATACCGGC 
GAACAGGATA CGCTGCCTCT TTGCCCACTG TGGATAGCCC GCCAGTTTAA GGAAGCGGCG 
CCTTTATGCG AAGGCGATAC CTGCGGCGCA GAAGCGCTCA GTCTGATGCT TGCCCGACGC 
GAATGGCGAG AAGGCTTTCT GGCGGAGCGG ATGCAGGATG AGATTCTGCA AGAGCAGATC 
CTGATTGAAA CCGAAGGCGA ACGCGTTGGA CAAATCAATG CGCTTTCCGT CATTGAGTTT 
CCCGGACATC CGCGCGCCTT TGGCGAACCG TCGCGAATTA GCTGTGTTGT GCATATCGGC 
GATGGCGAAT TTAACGATAT TGAGCGCAAG GCCGAACTTG GCGGGAATAT CCACGCTAAG 
GGAATGATGA TTATGCAGGC CTTCCTGATG TCTGAGTTGC AGCTGGAGCA ACAAATTCCC 
TTCTCTGCCT CGTTAACCTT TGAGCAGTCC TACAGCGAAG TGGATGGCGA TAGCGCCTCA 
ATGGCGGAAT TATGTGCGCT CATCAGCGCG CTGGCCAATG TGCCAGTGAA TCAAAACATT 
GCGATTACCG GCTCGGTCGA TCAGTTTGGT CGCGCGCAAC CGGTGGGCGG GCTAAACGAA 
AAAATTGAAG GTTTCTTCGC CATCTGCGAG CAGCGGGAAT TAAACGGTAA ACAGGGCGTA 
ATTATCCCTG CCGCCAACGT CCGCCATCTC AGTCTTAAAT CTGAACTGCT GCAAGCGGTT 
AAAGAAGAGA AGTTCACTAT CTGGGCGGTA GACGACGTGA CCGACGCCTT ACCGTTACTG 
TTAAATCTGG TGTGGGATGG CGAAGGTCAA ACGACGTTGA TGCAGACTAT CCAGGAGCGT 
ATCGCGCAGG CGACGCAACA GGAAGGCCGT CATCGTTTCC CGTGGCCATT ACGTTGGCTG 
AACGCTTTTA TTCCGAACTG A

Protein sequence

MTITKLAWRD LVPDSESYQE IFAQPHATDE NDTLLSDTQP RLQFALEQLI QPWASSSFML 
TKAPEEQEYL TLLSDAVRAL QTDAGQLTGG HYDVSGHTVH YRAAQNAQDN FATVTQVVSA 
DWVEAEQLFG CLRQYNGDII LQPGLVHQAN GGVLIISLRT LLAQPLLWMR LKAIVSRERF 
DWVAFDESRP LPVSVPSMPL KLKVILVGER ESLADFQEME PELAEQAIYS EFEDNLQIAD 
AEAMTLWCQW VTRIALRDNL PPPAPDAWPV LIREAVRYTG EQDTLPLCPL WIARQFKEAA 
PLCEGDTCGA EALSLMLARR EWREGFLAER MQDEILQEQI LIETEGERVG QINALSVIEF 
PGHPRAFGEP SRISCVVHIG DGEFNDIERK AELGGNIHAK GMMIMQAFLM SELQLEQQIP 
FSASLTFEQS YSEVDGDSAS MAELCALISA LANVPVNQNI AITGSVDQFG RAQPVGGLNE 
KIEGFFAICE QRELNGKQGV IIPAANVRHL SLKSELLQAV KEEKFTIWAV DDVTDALPLL 
LNLVWDGEGQ TTLMQTIQER IAQATQQEGR HRFPWPLRWL NAFIPN