Gene Sfum_0190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_0190
Symbol
ID	4461540
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	225125
End bp	226159
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	60%
IMG OID	639700945
Product	deoxyguanosinetriphosphate triphosphohydrolase-like protein
Protein accession	YP_844327
Protein GI	116747640
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0232] dGTP triphosphohydrolase
TIGRFAM ID	[TIGR01353] deoxyguanosinetriphosphate triphosphohydrolase, putative

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.230443
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGCCACG AGTTGGAGGA ACGTGAAGCA CGGTTTCTCG ATCCCCGTGC GCAGCTCAGC 
AGGGAGACCA GAGGACGGCT GAAACCCGAG ACGGAATGCA CTCTGCGCAC GGCCTACCAG 
CGGGACCGCG ATCGAATCGT TCACTGCAAG GCTTTCAGAA GGCTGAAACA CAAGACTCAG 
GTCTTCCTGT CTCCGACGGG AGACCACTAC CGTACGCGGC TCACGCACAC CCTGGAAACC 
TCCCAGATTG CCCGCACCAT CGGCAGGGCG CTGGCCTTGA ACGAAGATCT TATCGAGGCC 
GTCGCGCTCG GACACGACTT GGGCCACACG GCGTTCGGCC ACGGGGGCGA GAGCGTGCTC 
AACGATCTCG TTCCCGGAGG TTTCTTTCAC AACGAGCAGA GCCTGCGCAT TGTCGACATC 
CTCGAAAAAA ACGGGGAGGG GCTCAATCTC ACCCACGAAG TGCGCGACGG CATCCTCAAA 
CATTCCAAGG GGCGCGCGGA TCCGATCCTG CTCGACCCTG AAGCCAGAGC GGAAACGCTG 
GAAGGTCAGG TGGTCCGGGT TGCGGACATC ACGGCTTATC TCAACCATGA CCTGGACGAC 
GCCCTGAGGG CTGAAATCCT CAGTGCCGAT GCCATTCCCC CCGATATCCG GATGCACCTC 
GGAGCCCGTC ATTCTCAGCG CATCCACGCG ATGGTCGAGG ATGTCATTCA CTCGACCCTG 
GAGGGCGATC TCATCGAAGT GCGCATGAGC GAGGCGATGC TCGCCCGGGT TGACCAGCTC 
AGGGAGTTCC TTTTCGAGCA CGTTTACGAT CTGCCTCAGG TCAGGGAAGA ATTCAGGCGC 
GTCCGGAAGA TCATCGAGGA TCTCTTCGAC GTACTGATGA AGGATGATGC GGTGTTTCGG 
GAAGAGATCG GCACGCCGCG CGACGGCACG CTCAAGGAGC GGCAGGTGTA CGACCATATC 
GCGGGAATGA CTGACCGTTA CGCTCTCGAC CTGTACAAAA AGATCTTTCT TCCCAAGCCA 
TGGATGAAAC TGTGA

Protein sequence

MRHELEEREA RFLDPRAQLS RETRGRLKPE TECTLRTAYQ RDRDRIVHCK AFRRLKHKTQ 
VFLSPTGDHY RTRLTHTLET SQIARTIGRA LALNEDLIEA VALGHDLGHT AFGHGGESVL 
NDLVPGGFFH NEQSLRIVDI LEKNGEGLNL THEVRDGILK HSKGRADPIL LDPEARAETL 
EGQVVRVADI TAYLNHDLDD ALRAEILSAD AIPPDIRMHL GARHSQRIHA MVEDVIHSTL 
EGDLIEVRMS EAMLARVDQL REFLFEHVYD LPQVREEFRR VRKIIEDLFD VLMKDDAVFR 
EEIGTPRDGT LKERQVYDHI AGMTDRYALD LYKKIFLPKP WMKL