Gene SeAg_B2641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B2641
Symbol
ID	6792800
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	+
Start bp	2572019
End bp	2573482
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	58%
IMG OID	642776830
Product	TPR repeat-containing protein YfgC
Protein accession	YP_002147447
Protein GI	197250318
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00482944
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCAGGC AGTTGAAAAA AAACCTGGTG GCAACCCTCA TTGCAGCATT GGCTCTCGGT 
CAGGTCGCGC CCGCATTTGC CGACCCTGCC GACACGCTGC CCGATATGGG AACCTCGGCA 
GGAAGCACGC TTTCTATCGG ACAAGAGATG CAAATGGGCG ACTTTTATGT GCGCCAGCTA 
CGCGGCAGCG CGCCGTTAAT CAACGATCCG CTGCTGGTGC AATACATTAA CGCGCTGGGG 
ATGCGTCTGG TCTCGCACGC CGACTCCGTC AAAACGCCCT TCCATTTTTT CTTGATCAAT 
AATGACGAAA TCAACGCGTT CGCGTTCTTT GGCGGCAATG TGGTGCTGCA CTCGGCGCTT 
TTTCGCTACG CGGATAACGA AAGCCAGCTA GCTTCAGTCA TGGCGCATGA AATCTCCCAC 
GTGACGCAGC GCCACCTGGC GCGCGCGATG GAAGATCAAA AGCGCAGCGC GCCGCTTACC 
TGGGTGGGCG CGCTGGGTTC CATTTTGCTG GCCATGGCCA GCCCACAGGC CGGTATGGCG 
GCACTAACCG GTACTCTGGC TGGAACGCGC CAGGGAATGA TAAGTTTCAC CCAGCAAAAT 
GAGCAAGAAG CCGACCGTAT TGGTATTCAG GTACTGCAAC GCGCCGGATT TGACCCACAG 
GCGATGCCCT CTTTCCTCGA AAAACTGCTC GACCAGGCGC GTTACTCCAC GCGTCCGCCT 
GAAATTTTGC TCACTCACCC CTTACCGGAA AGCCGCCTTG CGGATGCCCG CAACCGTGCC 
AACCAGATGC GCCCGGTCGT GGTGCAATCT TCCGCCGACT TTTATCTCGC CAAAGCGCGC 
GCCCTGGGAA TGTACAATTC CGGACGTAAC CAGCTCACCA GCGACCTGCT GGATCAGTGG 
TCTAAAGGCA ACGTGCGTCA GCAACATGCG GCGCAATATG GCCGGGCGTT GCAGGCGATG 
GAAGCGAGCA AGTACGATGA AGCGCGCAAA ACGTTGCAGC CGCTATTAAG CGCGGAACCG 
AACAACGCCT GGTATCTTGA CCTCGCCACC GATATTGACC TCGGGCAGAA AAGAGCCAAC 
GACGCGATTA ATCGCCTGAA AAATGCCCGC GATCTGCGCG TTAATCCTGT GCTGCAGTTA 
AACCTCGCCA ATGCGTACCT CCAGGGAGGC CAGCCGAAAG CGGCGGAAAC CATTCTGAAT 
CGCTACACCT TTAGCCATAA AGATGACGGT AACGGCTGGG ATCTGCTTGC TCAGGCCGAA 
GCCGCGCTGA ACAACCGCGA TCAGGAGCTG GCGGCGCGCG CTGAAAGTTA TGCGCTGGCG 
GGACGACTGG ATCAGGCAAT TTCACTGCTC AGTAGCGCCA GCGCCCAGGC AAAACTGGGT 
AGCCAGCAAC AGGCGCGTTA CGATGCGCGT ATCGACCAGC TGCGCCAGTT ACAGGAACGC 
TTCAAGCCAT ACACGAAAAT GTAA

Protein sequence

MFRQLKKNLV ATLIAALALG QVAPAFADPA DTLPDMGTSA GSTLSIGQEM QMGDFYVRQL 
RGSAPLINDP LLVQYINALG MRLVSHADSV KTPFHFFLIN NDEINAFAFF GGNVVLHSAL 
FRYADNESQL ASVMAHEISH VTQRHLARAM EDQKRSAPLT WVGALGSILL AMASPQAGMA 
ALTGTLAGTR QGMISFTQQN EQEADRIGIQ VLQRAGFDPQ AMPSFLEKLL DQARYSTRPP 
EILLTHPLPE SRLADARNRA NQMRPVVVQS SADFYLAKAR ALGMYNSGRN QLTSDLLDQW 
SKGNVRQQHA AQYGRALQAM EASKYDEARK TLQPLLSAEP NNAWYLDLAT DIDLGQKRAN 
DAINRLKNAR DLRVNPVLQL NLANAYLQGG QPKAAETILN RYTFSHKDDG NGWDLLAQAE 
AALNNRDQEL AARAESYALA GRLDQAISLL SSASAQAKLG SQQQARYDAR IDQLRQLQER 
FKPYTKM