Gene SeD_A2862 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A2862
Symbol
ID	6875134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	2736908
End bp	2738371
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	57%
IMG OID	642785913
Product	TPR repeat-containing protein YfgC
Protein accession	YP_002216563
Protein GI	198242783
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAGGC AGTTGAAAAA AAACCTGGTG GCAACCCTCA TTGCAGCATT GGCTCTCGGT 
CAGGTCGCGC CCGCATTTGC CGACCCTGCC GACACGCTGC CCGATATGGG AACCTCGGCA 
GGAAGCACGC TTTCTATCGG ACAAGAGATG CAAATGGGCG ACTTTTATGT GCGCCAGCTA 
CGCGGCAGCG CGCCGTTAAT CAACGATCCG CTGCTGGTGC AATACATTAA CGCGCTGGGT 
ATGCGTCTGG TCTCGCACGC CGACTCCGTC AAAACGCCCT TCCATTTTTT CTTGATCAAT 
AATGACGAAA TCAACGCCTT CGCGTTCTTT GGCGGCAATG TGGTGCTGCA CTCGGCGCTT 
TTTCGCTACG CGGATAACGA AAGCCAGCTA GCTTCAGTCA TGGCGCATGA AATCTCCCAC 
GTGACGCAGC GCCACCTGGC GCGCGCGATG GAAGATCAAA AGCGCAGCGC GCCGCTTACC 
TGGGTGGGCG CGCTGGGTTC CATTTTGCTG GCCATGGCCA GCCCACAGGC CGGTATGGCG 
GCGCTAACCG GTACTCTGGC GGGAACGCGC CAGGGAATGA TAAGTTTCAC CCAGCAAAAT 
GAGCAAGAAG CCGACCGTAT TGGTATTCAG GTACTGCAAC GCGCCGGATT TGACCCACAG 
GCGATGCCCT CTTTCCTCGA AAAACTGCTC GACCAGGCGC GTTACTCCAC GCGTCCGCCT 
GAAATTTTGC TCACTCACCC CTTACCGGAA AGCCGCCTTG CGGATGCCCG CAACCGTGCC 
AACCAGATGC GCCCGGTCGT GGTGCAATCT TCCGCCGACT TTTATTTCGC CAAAGCGCGC 
GCCCTGGGAA TGTACAATTC CGGACGTAAC CAGCTCACCA GCGACCTGCT GGATCAGTGG 
TCTAAAGGCA ACGTGCGTCA GCAACATGCG GCGCAATATG GCCGGGCGTT GCAGGCGATG 
GAAGCGAGCA AGTACGATGA AGCGCGCAAA ACGTTGCAGC CGCTGTTAAG CGCAGAACCG 
AACAATGCCT GGTATCTTGA CCTCGCCACC GATATTGACC TCGGGCAGAA AAGAGCCAAC 
GACGCGATTA ATCGCCTGAA AAATGCCCGC GATCTGCGCG TTAATCCTGT GCTGCAGTTA 
AACCTCGCCA ATGCGTACCT CCAGGGAGGC CAGCCAAAAG CGGCGGAAAC CATTCTGAAT 
CGCTACACCT TTAGCCATAA AGATGACGGT AACGGCTGGG ATCTGCTTGC TCAGGCCGAA 
GCCGCGCTGA ACAACCGCGA TCAGGAGCTG GCGGCGCGCG CTGAAAGTTA TGCGCTGGCG 
GGACGACTGG ATCAGGCAAT TTCACTGCTC AGTAGCGCCA GCGCCCAGGC AAAACTGGGT 
AGCCAGCAAC AGGCGCGTTA CGATGCGCGT ATCGACCAGC TGCGCCAGTT ACAGGAACGC 
TTCAAGCCAT ACACGAAAAT GTAA

Protein sequence

MFRQLKKNLV ATLIAALALG QVAPAFADPA DTLPDMGTSA GSTLSIGQEM QMGDFYVRQL 
RGSAPLINDP LLVQYINALG MRLVSHADSV KTPFHFFLIN NDEINAFAFF GGNVVLHSAL 
FRYADNESQL ASVMAHEISH VTQRHLARAM EDQKRSAPLT WVGALGSILL AMASPQAGMA 
ALTGTLAGTR QGMISFTQQN EQEADRIGIQ VLQRAGFDPQ AMPSFLEKLL DQARYSTRPP 
EILLTHPLPE SRLADARNRA NQMRPVVVQS SADFYFAKAR ALGMYNSGRN QLTSDLLDQW 
SKGNVRQQHA AQYGRALQAM EASKYDEARK TLQPLLSAEP NNAWYLDLAT DIDLGQKRAN 
DAINRLKNAR DLRVNPVLQL NLANAYLQGG QPKAAETILN RYTFSHKDDG NGWDLLAQAE 
AALNNRDQEL AARAESYALA GRLDQAISLL SSASAQAKLG SQQQARYDAR IDQLRQLQER 
FKPYTKM