Gene Sfum_3723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_3723
Symbol
ID	4457975
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	4538749
End bp	4539699
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	59%
IMG OID	639704496
Product	TRAP transporter solute receptor TAXI family protein
Protein accession	YP_847828
Protein GI	116751141
COG category	[R] General function prediction only
COG ID	[COG2358] TRAP-type uncharacterized transport system, periplasmic component
TIGRFAM ID	[TIGR02122] TRAP transporter solute receptor, TAXI family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAAAA GACTACTCGT CGTATCCGTT CTGCTCCTGG TCTTTGTGGG CACCCTCTGC 
TCGGCGCAAG CCGAAGAAGT CAGGCTGATT CTCGGCACGG GAGGCACCGC CGGGACCTAC 
TACCCGCTCG GGGGCTCCAT GGCCAAGATC TGGAATTCGA AGATTCCCGG CATGAACGTC 
ACGGCACAGA CCACGGGGGC TTCCGCCGAA AACGTTCGCC TGGTGAACAA GAAGGAAGCG 
GAGCTCGCGC TGGTCCAGAG CGACACGCTG GATTTCGCGT TCAAGGCCGA GCCTCCGTTC 
AAGGAGAAAC TCACGGCCAT GGCGGCCATT GCCGTGCTCT ATCCGGAAGT CATCCAGGTC 
GTGGTGCGCG CCGATAAGCC GGTCAAGACC TTCGCCGATC TCAAGGGACT GAAGATGGGC 
GTGGGAGCCC CGGGCAGCGG AACGGAGGCG AATTTCCGGC AGCTTTGCGA CGTGCACGGA 
CTGGTAAAAG GCGACATCAA CGCCCAGTAT CTTTCCTTTT CCGAGAGCGC CGAACAGTTC 
AAGGACAAGC ACATCGACGC CTTCCTCGTG ACGGCCGGTC TCCCCAACCC GGGCATCATG 
GACGTCAGCA CCCAGAACGA CATTCGGATC CTCAGCATTT CCGACGATAT GCTGAAGAAG 
ATCACGACCA AGTATCCTTT CCTCTCTCCC GTGAAGGTCC CTGCCAATAC CTACAAGAAC 
GTCCCCGAAG CGAGCACCGT GGCGGTGAAC GCCGTGCTCA TCGTGAATTC GGGGATCAAG 
GAGGACGTCG TCTACAACCT GACCAAGGCT CTGTTCGACA ACCAGCCGGA ACTGGCCGCG 
GCCCACGCCA AGGGCAAGGA AGTGAACCTG CAGACGGCGG TCAAGGGTGT GTCCATCCCG 
TTCCACCCGG GAGCGGTGAA GTACTACAAA GAAAAAGGCG TCATGAAATA G

Protein sequence

MMKRLLVVSV LLLVFVGTLC SAQAEEVRLI LGTGGTAGTY YPLGGSMAKI WNSKIPGMNV 
TAQTTGASAE NVRLVNKKEA ELALVQSDTL DFAFKAEPPF KEKLTAMAAI AVLYPEVIQV 
VVRADKPVKT FADLKGLKMG VGAPGSGTEA NFRQLCDVHG LVKGDINAQY LSFSESAEQF 
KDKHIDAFLV TAGLPNPGIM DVSTQNDIRI LSISDDMLKK ITTKYPFLSP VKVPANTYKN 
VPEASTVAVN AVLIVNSGIK EDVVYNLTKA LFDNQPELAA AHAKGKEVNL QTAVKGVSIP 
FHPGAVKYYK EKGVMK