Gene Sfum_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_2022
Symbol
ID	4459653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	2473983
End bp	2475734
Gene Length	1752 bp
Protein Length	583 aa
Translation table	11
GC content	60%
IMG OID	639702788
Product	thaumatin, pathogenesis-related protein
Protein accession	YP_846140
Protein GI	116749453
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.431794
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAACA TTCCCACTGC ACATCCGAAA ATGCCGTCCC ACAGTCTCAA GGCGGGTTTC 
CTGGCGGTCG TCCTGGCGGT CCTGCTCAGC GCCTCCCACG CCTTCGCCAC GCAGGTGCTT 
TATGTCATCG GGGGAACCAC TCCGACCGTG GGGGAACTGA TCCTCAAGGA CCGCCTGGTA 
AAAAGGGGAT TTGTGGTTGT GGTTCGAGAT ACCGGGAATG TCGCCGTCGC GAACGCCCTC 
GACAAGGATT TGATCATCAT CTCCGAGTCG GTGGTGTCCA CAGGGCTGAA GACGCTTCTG 
CGCGACGTGC ATACCCCCAT CATCTGCTTT GAACCCTACC AGTTCGACGA CCTGGGCATG 
ACGGATTCCA AGCCGGGCGA ATCGTACGGA TCGGTCGAAG AGCAACAGAA CCTGGTGATC 
GCCAGGCCGG GTCATCCCCT GGCCGCCTCG CTCGACGGCG TCGTGGAAGT CGCCGAACGG 
GACATCAGGA TGGGATTCGG CACGCCGGGG ACGAACGCCA TCCCCATCGC CACCCTGATC 
AACTCTCCGG ACATGTACGC GATTTTCGCC TACAAGGCGG GGGCGCGGAT GCCTGGGCTC 
GCGGCGCCGG GCATCCGCAT CGGCTACTAT CTGCCGCGGA ACGCCCCGAA CGTGATGACG 
GCCGAAGGGT GGAAACTGTT CGATGCCGCG GTGACTTGGG CCATGACCCC GCAATTGCCC 
GCCATACCGC CCACTCCGCC CGGCAAGAGG ACGCTCGTTT TTTACAACAA CTGTTCCCGG 
AAGATCTGGG TGGGCGCGTC CGGAACGGTT CCGGATTGTT CCGCGTGCAA CTGCGCCAAG 
CAAAGCTGCC CTGAAAAACC CTGGAAGGGT ACAAGCACCG GTTTCGAGCT TCTTCCGACA 
GCGAACAAAA ACACCAAGAT CATCCAGGTT CCAAACAACC TGCAATCGGC GGAATTCTGG 
GCGCGCACCG GCTGCAGATG GGAGACGAAC CCCAGCTGGG AGGGGCCGCG GTTCATCTGC 
GACACCGGCG ATTGCGGCAA CGCATCTGCG GGATTCAGGG TGCCGTGCAA CGGGGGCACC 
AAGGCTCCCC CCGCGAACGC CCTTGAAGTC ACTTTCAATC CGTCCACGGG ATTCTTCAAC 
GGAGTCGCCG TGATAAGAAC CGACACCTAC GATCTCACCA ACGTGGACGG TTACAGCCGC 
GCGATCAAGG TGGAACCCCT GAAGGGAAGG TACAAGAAAG TCAGCCCCTA CAACGGACTT 
CCAAAGTACA ACTGCGGGAA AGCGCAGTGC ACCTTCGACA TGAGGAAGTG CCCTCCGGAG 
CTGAGCGCGG TCGACGGGAG CGGGAAGAAA GTCTGCTGGA GCCTCTGCAA GGCGGTGATG 
GACCCGATCC AGCGTGAAAA GCATTCGGTG TTGAAGGCGA TCTACAACAA CCCCGACAAG 
CGAGCCCTGG TGTGCTGCGC CTGCGACTGC GGGGCCGGGT GCGGGTGCGG AGACATTCAC 
TGCAAGTACG GTTGTTCGCC CTACAACAAG AATCTGCCCA CCCCTCACGG AGGCATCTGC 
CATTACGAGA AATGGCCCAA ACCGAATGCG ACGTGGTGCA AGAATGCCGG GCTGAGCGAA 
GCGAACTGCA ACTATCAGGC GATTTACAAG AGCCAGTGCC CCGATGCATA CAGTTGGCAA 
TTCAATGACA ACAGCAGCAC CTTTCAGTGC AAGGACGCCG ATTACCTGAT CACCTTCTGC 
CCCAGCATGT AG

Protein sequence

MPNIPTAHPK MPSHSLKAGF LAVVLAVLLS ASHAFATQVL YVIGGTTPTV GELILKDRLV 
KRGFVVVVRD TGNVAVANAL DKDLIIISES VVSTGLKTLL RDVHTPIICF EPYQFDDLGM 
TDSKPGESYG SVEEQQNLVI ARPGHPLAAS LDGVVEVAER DIRMGFGTPG TNAIPIATLI 
NSPDMYAIFA YKAGARMPGL AAPGIRIGYY LPRNAPNVMT AEGWKLFDAA VTWAMTPQLP 
AIPPTPPGKR TLVFYNNCSR KIWVGASGTV PDCSACNCAK QSCPEKPWKG TSTGFELLPT 
ANKNTKIIQV PNNLQSAEFW ARTGCRWETN PSWEGPRFIC DTGDCGNASA GFRVPCNGGT 
KAPPANALEV TFNPSTGFFN GVAVIRTDTY DLTNVDGYSR AIKVEPLKGR YKKVSPYNGL 
PKYNCGKAQC TFDMRKCPPE LSAVDGSGKK VCWSLCKAVM DPIQREKHSV LKAIYNNPDK 
RALVCCACDC GAGCGCGDIH CKYGCSPYNK NLPTPHGGIC HYEKWPKPNA TWCKNAGLSE 
ANCNYQAIYK SQCPDAYSWQ FNDNSSTFQC KDADYLITFC PSM