Gene Sfum_1996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_1996
Symbol
ID	4459697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	2443969
End bp	2445537
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	63%
IMG OID	639702762
Product	AMMECR1 domain-containing protein
Protein accession	YP_846114
Protein GI	116749427
COG category	[R] General function prediction only [S] Function unknown
COG ID	[COG1355] Predicted dioxygenase [COG2078] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00296] uncharacterized protein, PH0010 family

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTTCC ACAATAAAGC GTACAGACGG TTTGTCTTCC TGCTCCTGGG GGCTGTGCTG 
GTCCTTTTCC GGTGCCCGGG CATTCAAGGC GACGGCAGCG CCGCGGCGGG GGCCCCGGAA 
CAGGTCAGAA AACCGGCGAT TGCGGGCACT TGGTATCCCG CTTCTCCGGT GGAGCTGAGA 
AAACAGATCG AGGGGTTTCT GAATCGGGTT CCGGAGCCCA AGCCTCGGGG GCAATTGGTT 
GCGCTGATCT CTCCGCACGC CGGCACCATC TATTCCGGAC AGGTTGCGGC CTACGGGTAC 
AAGCTCCTCG AGAAACAAAA ATTCGCATCC GTCATTGTCA TATCCCCGAG TCATCGTGCC 
CGTTTCGAAG GCGTGGCAAC CTACGAGCTG GGAGGTTTCC AGACGCCTCT GGGCATTGTT 
CCCCTCGACC GCGATCTGAT TGAAGCCCTG AGGCGTCGCG ACAAGCGCAT CGCCCATCGC 
CCGGAGGTCC ACTCGGAGGA ACATGCGCTG GAGATCCAGC TTCCCTTCCT GCAGACGGTC 
CTGGAAGAAT TCAAGCTGGT GCCGCTGATC ATGGGGGAGC AGGACTTCGC CACGTGCAAA 
CGGCTTGCCG AGGCGATCGC CGACACGGTC AGGGAGAAAC GGGTGTTGGT GATCGCCAGT 
TCCGATCTTT CGCATTTCCA TCCGTACGAA CGGGCCAAGG CCCTCGACAA GGTGGCGGCG 
GACCGGGTGG GTGCCCTCGA CCCGCAGGGG CTCAGCTACA GCCTGGCCGG AGGGGAGTGC 
GAAGCGTGCG GTGGCGGGCC CATGGTCACG GCGATGCTGG CCGCAATGCG GCTGGGGGCG 
AATTCGGCCG AGGTGCTGAA GGTCGCGAAC TCGGGTGACG TCACGGGAAA CAAGAACGAC 
GCACGGGGCG TGGTCGGGTA TATGTCGGCG GCCCTCTGGC GGGGCCCGTC GGGGAAGGCC 
GGGGCGGCCG GAACATTCGA TTTGATTGCG AAGGCCGAAG CCGCCGGGCC TCCGGAATCA 
ACCGCCGCAG GCTCCAACCT GACCGCCGAG GAGAAGGAGG CGTTGCACCG CATTGCCAAA 
CAGGCGATTG AGGCCAAGCT CCGAGGCGGC CCGGCGCCGT CCGTGGACAA GGCTTCGGGA 
AATCTGAAGG AGCCTCGAGG CGCTTTTGTG ACCCTGCACA AAAGAGGAGA GCTCAGGGGC 
TGTATCGGGC ACATCATTAC CAGCCGGCCC CTGATCGAGA CGGTGAGCGA GGTGGCGGTG 
GCGGCAGCCG TGCAGGACCC GCGTTTCAGG CCGGTGACCG CCGAGGAGTT CAAGGATTTG 
GATATTGAAA TCTCGGTTCT GACCCCGTTG CGGAAGATCA CCGGCGTGGA GGAGGTCGAG 
GTGGGAAAGC ACGGCCTGGT GATTCGCCGA AACGGTGCAT CCGGGCTCCT GCTTCCCCAG 
GTCGCGACAC AATACGGGTG GGACCGCAGG GCGTTTCTGG AAAACACGTG CAGGAAGGCG 
GGCCTGCCGT CGAACGCCTG GCAGGATGAG AGGACGGAGA TCTATGTTTT TTCCGCCGAA 
GTGTTCTGA

Protein sequence

MNFHNKAYRR FVFLLLGAVL VLFRCPGIQG DGSAAAGAPE QVRKPAIAGT WYPASPVELR 
KQIEGFLNRV PEPKPRGQLV ALISPHAGTI YSGQVAAYGY KLLEKQKFAS VIVISPSHRA 
RFEGVATYEL GGFQTPLGIV PLDRDLIEAL RRRDKRIAHR PEVHSEEHAL EIQLPFLQTV 
LEEFKLVPLI MGEQDFATCK RLAEAIADTV REKRVLVIAS SDLSHFHPYE RAKALDKVAA 
DRVGALDPQG LSYSLAGGEC EACGGGPMVT AMLAAMRLGA NSAEVLKVAN SGDVTGNKND 
ARGVVGYMSA ALWRGPSGKA GAAGTFDLIA KAEAAGPPES TAAGSNLTAE EKEALHRIAK 
QAIEAKLRGG PAPSVDKASG NLKEPRGAFV TLHKRGELRG CIGHIITSRP LIETVSEVAV 
AAAVQDPRFR PVTAEEFKDL DIEISVLTPL RKITGVEEVE VGKHGLVIRR NGASGLLLPQ 
VATQYGWDRR AFLENTCRKA GLPSNAWQDE RTEIYVFSAE VF