Gene Sfum_3822 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_3822
Symbol
ID	4457852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	4669431
End bp	4670714
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	62%
IMG OID	639704595
Product	phage protein D-like
Protein accession	YP_847926
Protein GI	116751239
COG category	[R] General function prediction only
COG ID	[COG3500] Phage protein D
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCTGG ATACCTTCAA ACCGACATTT CTGATTCAGA TCGAGGGGCA AGACCTCTCG 
AAGGACATCA CCCAGGAGAT CACCTCGTTC GTCTTCACCG ACAACGAGGA AGAGCTGGAT 
GTTCTCGAGC TGTCGGTGAC CGACCGCAAC CTGCAGTTCG TCGACGATCC GCTGTTCCAG 
GAAGGCAACG AGATCGTGGC CCGCTTCGGC TACGTGGGAA ACCTCTCCCC GCGCAAGAAG 
GCGGTCATCA AGGACATCGA TTACGATTTT CCGGAAAACG GTGATCCGAC CATCCGCATC 
AAGGCCTACG ACAAGGGCTT CAAACTGGCG GGCAAGGAAA ACCAGAAGGT CTGGCAGAAA 
CCCGCTCCCG GCATCCTCTA TTCGGAAATC GCCGAACAAG TCGCCGCAGC CAACGGCTTC 
ACGCCGGTGG TCACGGCCAC CAAGGGGACC CATCTCCGCG TCACCCAGAG CAACATCTCG 
GACGCCCAGT TCCTCAAGGA GCTGGCGGAA AAGGCCCGTG ACCGCGATGG CGAGGGCGTG 
AGCGGCTATG TCTTCTACAT CCAGGACGAC GAACTCCATT TCCATCCCCG CGAGCTCGAC 
CAGACGCCGC TTCTGACCCT CGAATATTTC ACCGACACCA AGGGCCTGTT GCGCTCGTTC 
CGCCCCAGCA CCCAATCCCA GGGAGCTAAG GGCGCGGGTG TCGAGACCAA GACGGTCGGC 
GTCGACCCGC GCAAGAAGGA CGTGGTCGAG CACAAGGCCA ACAACGCCAC CACGGCCGAG 
CGGACCGCCC TGGGCAAGCA GACCTATCTG GTCGACGGCA ACACCGGCGA AGGCAGCTTC 
AAGGAACAGG AGACGGGGCA GATCGTGCCC AGCTTCGACC GTGCCGAAGG CTTTCACGAA 
GAGCCGCGCC AGGAGCCTGC CCAGGACAGC GCCGAGGGCA AGTTCCGCGA GGCCGAGCTG 
CGCCAGGTCG AGGCGGACGC CGCCACCATC GGCATTCCCC AGCTACGCGC CAAGAAGAAC 
ATCGAGATCA AGGGCGTGGG CCGGAAGTTT TCCGGCATCT ACTACTGCCA CTCGGTGCGC 
CACAGCATCA GCGGCGCAGG CTATCTCTGC GAACTCAAAC TCAAGAAGAA CGCCCTCGGC 
AAGGGCGCGG GCGACAAGTC CGCCGAGTCC CAGGGCAAAC CCAACGACAA GGAGGCCCCG 
CCCACGCCGC AAAACGAGCC GCCAGCCATG GTGACCATCG ACGCGGACTC CGGCGCGGTC 
ACACAAGGAG GCGGCAATGG GTGA

Protein sequence

MDLDTFKPTF LIQIEGQDLS KDITQEITSF VFTDNEEELD VLELSVTDRN LQFVDDPLFQ 
EGNEIVARFG YVGNLSPRKK AVIKDIDYDF PENGDPTIRI KAYDKGFKLA GKENQKVWQK 
PAPGILYSEI AEQVAAANGF TPVVTATKGT HLRVTQSNIS DAQFLKELAE KARDRDGEGV 
SGYVFYIQDD ELHFHPRELD QTPLLTLEYF TDTKGLLRSF RPSTQSQGAK GAGVETKTVG 
VDPRKKDVVE HKANNATTAE RTALGKQTYL VDGNTGEGSF KEQETGQIVP SFDRAEGFHE 
EPRQEPAQDS AEGKFREAEL RQVEADAATI GIPQLRAKKN IEIKGVGRKF SGIYYCHSVR 
HSISGAGYLC ELKLKKNALG KGAGDKSAES QGKPNDKEAP PTPQNEPPAM VTIDADSGAV 
TQGGGNG