Gene Sfum_3337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_3337
Symbol
ID	4458330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	4088882
End bp	4090135
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	64%
IMG OID	639704109
Product	glycosyl transferase, group 1
Protein accession	YP_847445
Protein GI	116750758
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.809351
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAATCC TGCACGTCGT CAGGGGGGTG AACCAATCCT CGGGCACCAC TCACGCCATT 
CTTCCCATGG CCGAGGAACA GGCGCGGCGA GGACACGAGG TGTGGCTCTA TCACGTCCGC 
AAACCTCCCG GCGTGCTCGA GGCGGCTCCC GACCCCACAT TTGTGAAGAC CCGTGTCTTC 
GATCTGTCCC TTCCCTTCGA CCACCCCGGA TTCTCCACAA GCTTTGCCCG CGCGGTGTCG 
CGGGACATCG GCCGCTTCGA CGTGGTTCAC ATCCAGGCCG TGCGGAATTT CGCGACCTGG 
TGGACCATGC GTTGCGCTGC CGGAGCGGGT GTCCCTTACA TCGTCGCTCC CCAGGGGTCG 
TATGAAGACT GGAACCTGGG CCGACGGTCC GTGAGAAACC GTTTATATGA CCGGTTCTTC 
GAAATCCCTC TCCTGAACCG CGCGGCGCGG GTCCATTGCC TGACCCCGCG CGAAGTTGAG 
CAGGTCCGGG CGATGGGGGT CACCGCGAAG TGCGTGGTCA TTCCCAACGG CGTGCTCGTC 
GACGGAGCTC TGCCAGGGCC GGGACTGGAA CCAAATCCCA AACGAAACGC TTACAAGAAA 
ACGGACGGAT TGCGGCGGCT CCTTTTCCTC GGTCGCATCC ACCCCAAGAA GGGACTCGAC 
CTGTTGCTGC CCGCCTTTGC GCAGGCGGCT GAAAAGCTGC TCGACCTGCG GCTGGTGATC 
GCGGGGTCCG ACAACGGGAG CGGGGAACTC GTCAAGACGA TCGCCGCCGC GGAAGCGCTC 
TTCCCCGGCC TGGTGGACTC CTCCTCTGCC CGGCCAACCC CGGCGTCCGC CCGCCGTCAC 
GGTGCCGCGA TCCGCGAGGA GAATCGTGCC CCGGCTCGTA TCGTGTTTCT GGGAGAGGTG 
AAAGGCCGGG CGAAAGAAGC CTGCTTCGCC CTGGCCGACG CCTTCATCCT GCCTTCGTAT 
TCCGAGGGAT TGCCCGTGGC GGTGCTTGAG GCCCTCGCAC ACGGGTTGCC CACCATCGTG 
ACCGACGGCT GCAACCTCCC CGAAATCGCC CGGGAAGGAG CCGGAGTGCA GGCCGATACC 
ACGCCCGACG GCGTGGCGGA TGCAATTTTG AGGCTGTTCG CGGATTCAAC CGCGCTGGCT 
TCCTGTGCCC AAGCCGCACG AAACCTTGCG CTGGAACGCT TCTCCTGGCC GAAGATCGTT 
GACCGCCTGC TTGCGGTCTA CGCGGCTCTG CCAATAGCTC ATTCATTTGG TTGA

Protein sequence

MKILHVVRGV NQSSGTTHAI LPMAEEQARR GHEVWLYHVR KPPGVLEAAP DPTFVKTRVF 
DLSLPFDHPG FSTSFARAVS RDIGRFDVVH IQAVRNFATW WTMRCAAGAG VPYIVAPQGS 
YEDWNLGRRS VRNRLYDRFF EIPLLNRAAR VHCLTPREVE QVRAMGVTAK CVVIPNGVLV 
DGALPGPGLE PNPKRNAYKK TDGLRRLLFL GRIHPKKGLD LLLPAFAQAA EKLLDLRLVI 
AGSDNGSGEL VKTIAAAEAL FPGLVDSSSA RPTPASARRH GAAIREENRA PARIVFLGEV 
KGRAKEACFA LADAFILPSY SEGLPVAVLE ALAHGLPTIV TDGCNLPEIA REGAGVQADT 
TPDGVADAIL RLFADSTALA SCAQAARNLA LERFSWPKIV DRLLAVYAAL PIAHSFG