Gene Sfum_1963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_1963
Symbol
ID	4459734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	2400458
End bp	2401606
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	60%
IMG OID	639702731
Product	extracellular solute-binding protein
Protein accession	YP_846083
Protein GI	116749396
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.503489
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCGA TGCGGTACCG GCTGATGCGG GGGTGGATTC CGGCGGTGGC GGTGGCGGTG 
GCGGTATGCC TTGTCCCGGT TTTGCGGGGG GGTGCGCGTG GCGCACAGGA CGAGAAGGAC 
TATGCCGTCG CCGTCTTCGT GAGCGGATTG CCCTTCTGTG GCAGGGCGAC CGACGGCGAG 
TACTTCGGGT TTGAGGTGGA ACTGTGGAGG GAAATCGCCC AGCGGGTGGG GATCAAGTAT 
CACCTGGAGG AAACGAGTCG CTTCCCGGCA GCCCTGCAGG CGCTGTCCGA AGGGAAGGCG 
GACTTCGCCC TCGCCACGGT CACCATGACG GGCAAGCGCG CGCATTCCAT GCAATTTCTC 
TATCCCTACT ACGTTTCCGG GCAGGGGATC CTGGTCAATG TCAAAACGGC CCGCCCCCTC 
GCGGTGTTCG CCGGAGTCCT GTGGTCCTCC GCGATCTTGC ATGCAGTGGT CCTGCTCGTT 
GTCCTCAACA TCCTCTACGG GCACATCCTG TGGATCGTCG AACGCAAGAA GAATCCACTG 
GTGAGCGAGC GTTACATTCC GGGAGTGCTC GAAGCCATGT GGTGCGCTTT TGCCATCAAA 
ACGACCATCG GTTTCGGCGA TCTTGTCCCG CGGATTTGGC TGGCGCGGCT GATCGCCGTC 
CCGATCTGGC TCACCGGCAT TTTCGTTGTG TCGGTAATCA GCGCTCAAAT GGTCGGGGAG 
TATGTCGCGC ACAGGTTCGA CATCGGTTCC GTCGCCAATT ACTACGATCT TGCCAGGAAG 
AAGGTGACGG TGGTTGAAGG GACGACCGGC TATGATTCCG TCAAGGAACT GGGACCAAAG 
AAGATCGTGC AGGTGGAAAA CCCGGTCGAT GGGTACTTGA AACTCCTCGA AAATGAGGTG 
GATGCGGCGG TGTTCGACTA TCCTTTCCTC GTGCACGCCG CTCAAGTCAT GCGCGCCGAA 
GGCAAGAAGG TGAGAGTGGT GGGGCAAGCC TTCACCGAGG AATTGATCGC GATTCCCGTG 
AGCCTACAGC TCGCCGCTCG GGACCCCGCT TTAATCGCGC GGATCAACAG GACCATCCTC 
GAGCTCCGCG ACGAAGGCTT CATCGACAGC CTGAGACTCA GATACATTGA AAGTCTCGAT 
GCCGGTTAA

Protein sequence

MKPMRYRLMR GWIPAVAVAV AVCLVPVLRG GARGAQDEKD YAVAVFVSGL PFCGRATDGE 
YFGFEVELWR EIAQRVGIKY HLEETSRFPA ALQALSEGKA DFALATVTMT GKRAHSMQFL 
YPYYVSGQGI LVNVKTARPL AVFAGVLWSS AILHAVVLLV VLNILYGHIL WIVERKKNPL 
VSERYIPGVL EAMWCAFAIK TTIGFGDLVP RIWLARLIAV PIWLTGIFVV SVISAQMVGE 
YVAHRFDIGS VANYYDLARK KVTVVEGTTG YDSVKELGPK KIVQVENPVD GYLKLLENEV 
DAAVFDYPFL VHAAQVMRAE GKKVRVVGQA FTEELIAIPV SLQLAARDPA LIARINRTIL 
ELRDEGFIDS LRLRYIESLD AG