Gene SeHA_C2753 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C2753
Symbol
ID	6490289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	2664494
End bp	2665957
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	57%
IMG OID	642742930
Product	TPR repeat-containing protein YfgC
Protein accession	YP_002046557
Protein GI	194448280
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	90
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAGGC AGTTGAAAAA AAACCTGGTG GCAACCCTCA TTGCAGCATT GGCTCTCGGT 
CAGGTCGCGC CCGCATTTGC CGACCCTGCC GACACGCTGC CCGATATGGG AACCTCGGCA 
GGAAGCACGC TTTCTATCGG ACAAGAGATG CAAATGGGCG ACTTTTATGT ACGCCAGCTA 
CGCGGTAGCG CGCCGTTAAT CAACGATCCG CTGCTGGTGC AATACATTAA CGCGCTGGGG 
ATGCGTCTGG TCTCGCACGC CGACTCCGTC AAAACGCCCT TCCATTTTTT CTTGATCAAT 
AATGACGAAA TCAACGCGTT CGCGTTCTTT GGCGGCAATG TGGTGCTGCA CTCGGCGCTT 
TTTCGCTACG CGGATAACGA AAGCCAGCTA GCTTCAGTCA TGGCGCATGA AATCTCCCAC 
GTGACGCAGC GCCACCTGGC GCGCGCGATG GAAGATCAAA AGCGCAGCGC GCCGCTTACC 
TGGGTGGGCG CGCTGGGTTC CATTTTGCTG GCCATGGCCA GCCCACAGGC CGGTATGGCG 
GCGCTAACCG GTACTCTGGC GGGAACGCGC CAGGGAATGA TAAGTTTCAC CCAGCAAAAT 
GAGCAAGAAG CCGACCGTAT TGGTATTCAG GTACTGCAAC GCGCCGGATT TGACCCACAG 
GCGATGCCCT CTTTCCTCGA AAAACTGCTC GACCAGGCGC GTTACTCCAC GCGTCCGCCT 
GAAATTTTGC TCACTCACCC CTTACCGGAA AGCCGCCTTG CGGATGCCCG CAACCGTGCC 
AACCAGATGC GCCCGGTCGT GGTGCAATCT TCCGCCGACT TTTATTTCGC CAAAGCGCGC 
GCCCTGGGAA TGTACAATTC CGGACGTAAC CAGCTCACCA GCGACCTGCT GGATCAGTGG 
TCTAAAGGCA ACGTGCGTCA GCAACATGCG GCGCAATATG GCCGGGCGTT GCAGGCGATG 
GAAGCGAGCA AGTACGATGA AGCGCGCAAA ACGTTGCAGC CGCTGTTAAG CGCAGAACCG 
AACAATGCCT GGTATCTTGA CCTCGCCACC GATATTGACC TCGGGCAGAA AAGAGCCAAC 
GACGCGATTA ATCGCCTGAA AAATGCCCGC GATCTGCGCG TTAATCCTGT GCTGCAGTTA 
AACCTCGCCA ATGCGTACCT CCAGGGAGGC CAGCCAAAAG CGGCGGAAAC CATTCTGAAT 
CGCTACACCT TTAGCCATAA AGATGACGGT AACGGCTGGG ATCTGCTTGC TCAGGCCGAA 
GCCGCGCTGA ACAACCGCGA TCAGGAGCTG GCGGCGCGCG CTGAAAGTTA TGCGCTGGCG 
GGACGACTGG ATCAGGCAAT TTCACTGCTC AGTAGCGCCA GCGCCCAGGC AAAACTGGGT 
AGCCAGCAAC AGGCGCGTTA CGATGCGCGT ATCGACCAGC TGCGCCAGTT ACAGGAACGC 
TTCAAGCCAT ACACGAAAAT GTAA

Protein sequence

MFRQLKKNLV ATLIAALALG QVAPAFADPA DTLPDMGTSA GSTLSIGQEM QMGDFYVRQL 
RGSAPLINDP LLVQYINALG MRLVSHADSV KTPFHFFLIN NDEINAFAFF GGNVVLHSAL 
FRYADNESQL ASVMAHEISH VTQRHLARAM EDQKRSAPLT WVGALGSILL AMASPQAGMA 
ALTGTLAGTR QGMISFTQQN EQEADRIGIQ VLQRAGFDPQ AMPSFLEKLL DQARYSTRPP 
EILLTHPLPE SRLADARNRA NQMRPVVVQS SADFYFAKAR ALGMYNSGRN QLTSDLLDQW 
SKGNVRQQHA AQYGRALQAM EASKYDEARK TLQPLLSAEP NNAWYLDLAT DIDLGQKRAN 
DAINRLKNAR DLRVNPVLQL NLANAYLQGG QPKAAETILN RYTFSHKDDG NGWDLLAQAE 
AALNNRDQEL AARAESYALA GRLDQAISLL SSASAQAKLG SQQQARYDAR IDQLRQLQER 
FKPYTKM