Gene Sfum_0041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_0041
Symbol
ID	4460981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	55576
End bp	56631
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	65%
IMG OID	639700793
Product	chorismate synthase
Protein accession	YP_844179
Protein GI	116747492
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0022126
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.467855
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGGGA GCAGCTTCGG CAGGCTTTTT CGTATCACCA CCTGGGGAGA ATCGCACGGC 
CCCGCACTGG GGGTCGTAAT AGACGGCTGT CCGCCGGGAA TCCCGTTGGC TCCCGAAGAC 
ATCCAGCGCG ATCTCGAACG GCGCCGTCCC GGCAAGCGCC TCACCTCACC CCGCGGCGAA 
CCGGACCGGG TGGAGATTCT CTCGGGCGTC TTTCAGGGGG TCACCACAGG CACGCCCATC 
AGCCTGGTGA TTTTCAACCG GGATGTCCGC AGCGGCGATT ACACGGAATT GGCCGAAGTT 
TACCGACCCG GGCACGGCGA CCGCACCTAC GAACAAAAAT ACGGCGTCAG GGACTGGCGC 
GGAGGAGGCC GGAGCTCGGG GCGCGAGACC GCCGCCCGTG TGGCCGCCGG CGCCGTCGCC 
CGCAAGTTCC TGGCCGGCCG TGGCGTTGAA GTGAAAGCCT ACACGGTTGC CTTCGCCGGC 
TTGCATGTGG ACTCCTTCAA CCGGGACGAA ATCGATCGCA ATCCCTTTTT CTGCCCGGAT 
GCGACAGCCG CAGCCGCCAT GGAGCGTCGC GTCGAGGAAC TGCGGGATGC GGGGGACTCC 
TGCGGAGGCG TCGTCGAAGT GTCGGCAAGA GGCTGTCCGG CGGGCCTCGG AGAGCCTGTC 
TTCGACAAAT TGGACGCGCG CCTGGCCGGG GCGCTCATGT CCGTGGGAGC AGTGAAAGGA 
GTGGAGATCG GCGCCGGTTT TGCCGCCGCC GCCATGCTCG GCAGCGAGAA CAACGACCCC 
CTTACCCCCG ATGGCTATGC AAGCAACAAT GCCGGCGGCG TTCTGGCGGG AATTTCCACC 
GGGATGGACA TCGTCGCGAG GGCGGCCGTC AAACCCATAC CCTCCATCTC AAAACCGCAA 
CAGACCGTCA ACACCAGGGG TGAACCCGTC ACCCTCTCCA TCAAAGGACG ACACGACGTA 
TCGGCCATCC CGCGCATCGT CCCGGTGTGC GAAGCCATGG TTCTCCTGGT GCTGGCCGAC 
TTCATGCTTC ACCCGGCGCC CGTGGAAAAG CGGTGA

Protein sequence

MAGSSFGRLF RITTWGESHG PALGVVIDGC PPGIPLAPED IQRDLERRRP GKRLTSPRGE 
PDRVEILSGV FQGVTTGTPI SLVIFNRDVR SGDYTELAEV YRPGHGDRTY EQKYGVRDWR 
GGGRSSGRET AARVAAGAVA RKFLAGRGVE VKAYTVAFAG LHVDSFNRDE IDRNPFFCPD 
ATAAAAMERR VEELRDAGDS CGGVVEVSAR GCPAGLGEPV FDKLDARLAG ALMSVGAVKG 
VEIGAGFAAA AMLGSENNDP LTPDGYASNN AGGVLAGIST GMDIVARAAV KPIPSISKPQ 
QTVNTRGEPV TLSIKGRHDV SAIPRIVPVC EAMVLLVLAD FMLHPAPVEK R