Gene Sfum_3753 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_3753
Symbol
ID	4457920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	-
Start bp	4586543
End bp	4587574
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	60%
IMG OID	639704527
Product	peptidase U32
Protein accession	YP_847858
Protein GI	116751171
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0826] Collagenase and related proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGAAC TGCTGGCACC CGGCGGAAGT CTCGAGATGG TGGAAGAAGT CTTTCGGCAG 
GGCGCCGATG CCGTCTACGT AGGCTCCAAG GGATTCAGCA GGCGCAAGTG CGCGTGGGAG 
CTCGAAGATT CTCAAATCCG GGACGCCGTC GCCATAGGGC GGCGGATGAA CGGCAGAATC 
CGTGTTGCCG TCAATGCCGA GGTGCCGCGG GAAAAGTCCT CCATTGTGAT GCGCAAGATC 
GGCAAATACG CGGAGTGGGG AATCGAGGGA GTCATCGTCA AGAGCCCTTT TATCATGGAA 
ATGGTAAAGG AGGGTTTCCC GGAGCTGGTC ATCCATGCCA GCGTGGGGTG CAATATCCGG 
ACGCCCGAAC AGATGTCCGA ATACAAGGCA TATGGGGCAA CCCAGGTGGT GGCTTCCACG 
GAAATCGACA GCGTGACGAA GTTGAGAGCG TTCAAGGAGT CCGCCGACAG GCTCGGACTC 
GGCACGGAGG TCCTGATCCA CGGCAACCGT TGCCTGGGCG GCGTGGGCAA CTGCATGTTC 
CACGAGCTCA TCAGCGACTC GTACATCAAA CGTATCCACC ACGACGAAGA AGGCAACGAA 
ATCGTGGAGT ACGAAGGCTG GCCCGACCGG AGCGGCAGCT GTTTCCGGCT GTGTCTTTTG 
ACCGATGCGC AGCGGGAGAA GGTACTGCGG CAGCGCCGCC ATCGCGATGA GGAAATTCGG 
GCGATCAACG AGCGTATCCG GCTGCACCCC AATGTCGCAT TCATGATCAA CGGCGAGGAA 
CTCTGGGACT ACCTGGGGAT CGGGCTTCAC ACGGTCAAGG TCCAGGGCCG CGAGTATGCA 
ACCCCCCTCA TCGGGCGGAT GATCGGAATC TACCGCAGGC TGATCGACGC TTTTGGTTCC 
GGCAGGGCTT GTGCCGAACC GGAACTCGTC GCCTTGCAGC GTGAGCTGGC CGAAATCGCC 
GCCGACCGGG ACCGTGCCCG CATGGAAAAA ACCCGGGAGC TGCATCGCAA CATCAAGGGC 
TTGTACGCCT GA

Protein sequence

MNELLAPGGS LEMVEEVFRQ GADAVYVGSK GFSRRKCAWE LEDSQIRDAV AIGRRMNGRI 
RVAVNAEVPR EKSSIVMRKI GKYAEWGIEG VIVKSPFIME MVKEGFPELV IHASVGCNIR 
TPEQMSEYKA YGATQVVAST EIDSVTKLRA FKESADRLGL GTEVLIHGNR CLGGVGNCMF 
HELISDSYIK RIHHDEEGNE IVEYEGWPDR SGSCFRLCLL TDAQREKVLR QRRHRDEEIR 
AINERIRLHP NVAFMINGEE LWDYLGIGLH TVKVQGREYA TPLIGRMIGI YRRLIDAFGS 
GRACAEPELV ALQRELAEIA ADRDRARMEK TRELHRNIKG LYA