Gene Sfum_4083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_4083
Symbol
ID	4457572
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	4966435
End bp	4967565
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	60%
IMG OID	639704853
Product	solute binding protein-like
Protein accession	YP_848183
Protein GI	116751496
COG category	[R] General function prediction only
COG ID	[COG3889] Predicted solute binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.0424858
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0912112
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTCCTT ACATTCGACT ATTAGGAAAG AATCGGTTCA AAACGAGCTT TACTTTTCTG 
ATGGTGTTAT GTGCCGTGGC GTGCGCGGGC ATCGCCCGGG GTGCTTCAGG CCCCGTTGGA 
AAGGCCGCGG TCTTGAAAGG CGCCGTGTTC GTGGAGCGGG AAGGAAGGAG CATTGCGGCG 
AAAGCCGGCG AATCCGTCTT TCTCAAGGAC AAGTGGCAGA CGAAGGGGGA TGGTTCCGTG 
GAGATCGTCT TCCTTGATGA AAGCCGGGTA AAAATGGCCC CGGGATCGGT GATGGAGATC 
ACTGAGTATT TGTACGATCC TTCGCAAAAA AGCCGTCAGG GGCTTCTGTC CATGATGTCG 
GGGAAAGCGC GTTTCGTTGT GCAGGATTTG CAGGATTTCA AGGAAAAGCG GTTCCGGGTG 
CAAGGTCAGA CGGCGGTTGT GGGCACCCGC GACACGGACT TCGTGGTGCG GGTGCGTTCG 
GGTTCGGCGA AGGAAAGCAT ATGCAGGGAG GAACTGCTGG AAGCTCTGTG CATCGAGAAT 
GTGATCATAG CCGTCAACCG CACTACCCCC GATAAGGGGG CCGTCATCAC CACCAACATG 
ATCACTCAGG TCTGCGGGAA GAATCCGCCC ACCCCGCCCC GGTTCGCGAC TCCCGCCGAG 
CGTGCCGATC TGCTGAAGGG GCTGGAGGAA ATCGGCTCCA GGAAGCTGCC TCGCGCCGAG 
ACCGGCATCG GCGTGCCCGA AACGAGCGGA GGGGAGACTT CGACCGGTCT CACGCACACC 
CCTCCGCCTG AAGTGATCGT GCCGCCATTC ATTTTCCCGT CCACGACGAC AACGACAACG 
AGCTCATCGA CCACCACGAC GTCGACCACG TTGCCGTGGC AAGTGCCGAG GACCACTACG 
ACCACCTCGA CCACTTCGAC CACGATGCCG ACGACGACGT CCACCACAAG CACAAGCACG 
TCCACGACGA GCACATCGAC GACCAGTACG TCGACAACGA GTACCACGAC GACGAGCACG 
TCCACAACGA GCACCTCGAC GACGAGCACG TCGACAACCA GCACCTCGAC GACGACCACA 
CTCCCGCAGC CTCCACAGCC TCCCATCAGA GGTGGTCCGC GGGGCAGGTG A

Protein sequence

MLPYIRLLGK NRFKTSFTFL MVLCAVACAG IARGASGPVG KAAVLKGAVF VEREGRSIAA 
KAGESVFLKD KWQTKGDGSV EIVFLDESRV KMAPGSVMEI TEYLYDPSQK SRQGLLSMMS 
GKARFVVQDL QDFKEKRFRV QGQTAVVGTR DTDFVVRVRS GSAKESICRE ELLEALCIEN 
VIIAVNRTTP DKGAVITTNM ITQVCGKNPP TPPRFATPAE RADLLKGLEE IGSRKLPRAE 
TGIGVPETSG GETSTGLTHT PPPEVIVPPF IFPSTTTTTT SSSTTTTSTT LPWQVPRTTT 
TTSTTSTTMP TTTSTTSTST STTSTSTTST STTSTTTTST STTSTSTTST STTSTSTTTT 
LPQPPQPPIR GGPRGR