Gene Sfum_1107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_1107
Symbol
ID	4461077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	1376172
End bp	1377563
Gene Length	1392 bp
Protein Length	463 aa
Translation table	11
GC content	60%
IMG OID	639701872
Product	hypothetical protein
Protein accession	YP_845235
Protein GI	116748548
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.655158
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGAGGA ACCCCTTGAA GACCCGCTCC GGCCGGCCCG GACTTCCGAG ATTGCTCCTG 
ATCGTTGCCT CGCTTCTCCT GCTCTGCGTC TTGAGCCTCC CGGCCGTTGC ATCGGCGGAA 
TGGGTGCGGC ATTACGGCGG TGAGTATCGG GACGAAGCCA AGGCCATCGC CGTGGACTCC 
GCCGGCAGCG TCTACGTCAC GGGCACATCG GCGAATTACG CAGAGGAGAA TTTCACGTCC 
CTCGATTATG CCACCGTCAA GTACGACACG AATGGAAACC GAAAGTGGGT GCGGCGATAT 
GACGGCCCGA AGCACTACAT TGATCAAGCC GCGGCGATTG CCGTGGACCG CGACGGGAAC 
GTCTACGTCA CGGGCACATC GATGGGACTT CGTTCAGGCT ACGATTATGC GACCATCAAG 
TACGACACGA ACGGAAAGCC GCAATGGGTG AGGCGATACG ACGGCCCCGC GGGCATGAAC 
GACACGGCCA CGGCTCTGGC CGTGGATGCC GCCGGCAACA TCTATGTGAC GGGCAAGTCG 
GAAAATTACA CCTACCTCGA CTATGCGACC GTCAAGTACG ACGCGGATGG AAATCAGAGG 
TGGGTGGCTC GCTATAACGG CCCGAAGAGC TCCGATGACG AGGCGACGGC CATCGCCGTA 
GACCGCAACG GGAACGTCTA CGTGACGGGC GCGTCGGTGG GAATGCAATC AGGCTACGAT 
TATGCCACCG TCAAGTACGA CGCGAAGGGA AACCGAAAGT GGGTGAGGCG ATACAACGGC 
CCCGGCAACA AGGATGACAA GGCCGCGGCC ATTGCAGTGG ACCGGAGCGG AAACGTCCAT 
GTCACGGGAG GTGCGGTTTG GCCCGATAAT TATGGCGGCC TGAATTATGC CACCATCAAG 
TACGACACGA ATGGAAACCG AAAGTGGGTC AGACGCTACA ACGGCCCATG GAATGAGACG 
GACAGAGCCA AGGCCATCGC GGTGGACGCC GCCGGCAACG TCTATGTGAC GGGTGAAGCG 
GGGACAAATA ACTTATTATT CTTTGATTAC GTAACCATCA AGTACGACCC CGACGGCAAC 
CGGCAATGGA TGAGACGCCT CGTGGGGCCG GACGGATGGA GCGACAGCCC CTCCGGCATG 
GCCGTGGACC CCGCCGGCAA CGTCTGCGTG ACCGGCCAGG TGGAAGGCGA TCTGGGGCAC 
TTGCATTATG GAACCGTCAA GTACGATACG AATGGGGTCC GGCAATGGGT GAGGTTCTAC 
GCGGAGATCT CCGGCGCGGC TGCAGCCGTG GCCGTGGACG GCGGCGGCAA TGTCTACGTC 
ACGGGCCAAT CATACTCGCG CGACAAATAC CAGGACTATG CCACCATCAA GTACAACGCG 
AACGGGGACT GA

Protein sequence

MRRNPLKTRS GRPGLPRLLL IVASLLLLCV LSLPAVASAE WVRHYGGEYR DEAKAIAVDS 
AGSVYVTGTS ANYAEENFTS LDYATVKYDT NGNRKWVRRY DGPKHYIDQA AAIAVDRDGN 
VYVTGTSMGL RSGYDYATIK YDTNGKPQWV RRYDGPAGMN DTATALAVDA AGNIYVTGKS 
ENYTYLDYAT VKYDADGNQR WVARYNGPKS SDDEATAIAV DRNGNVYVTG ASVGMQSGYD 
YATVKYDAKG NRKWVRRYNG PGNKDDKAAA IAVDRSGNVH VTGGAVWPDN YGGLNYATIK 
YDTNGNRKWV RRYNGPWNET DRAKAIAVDA AGNVYVTGEA GTNNLLFFDY VTIKYDPDGN 
RQWMRRLVGP DGWSDSPSGM AVDPAGNVCV TGQVEGDLGH LHYGTVKYDT NGVRQWVRFY 
AEISGAAAAV AVDGGGNVYV TGQSYSRDKY QDYATIKYNA NGD