Gene Sfum_0984 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sfum_0984
Symbol
ID	4460027
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Syntrophobacter fumaroxidans MPOB
Kingdom	Bacteria
Replicon accession	NC_008554
Strand	+
Start bp	1209391
End bp	1210848
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	57%
IMG OID	639701748
Product	protease Do
Protein accession	YP_845114
Protein GI	116748427
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0265] Trypsin-like serine proteases, typically periplasmic, contain C-terminal PDZ domain
TIGRFAM ID	[TIGR02037] periplasmic serine protease, Do/DeqQ family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGTTT TCCGGACAGG TAAGGCTGGG ATTGTTTTTC GATGGATTCG GTTGTTTACG 
TTCGTTGTCG CTCTGCCCTG TTTCCTGCTG TTGTCGCAAA GCATCCCCTC CGCGCACGGA 
GCCGCATGGC AGCAGGGCCC TCCTTCGTTT GCCGATCTTG CCGAACAAGT CAAGCATGCG 
GTTGTCAATA TTTCCACCAC GCAGGTCTTG AAGGAAAGCC CGATGCAACA GTTCATGGGA 
CCGAACTCTC CCTTCCGCGA TTTTTTCGAT GACGATTTCA TGAAGCGATT CTTCGGTGAA 
CAACCTCAAG GACAAAGAAA GGGGCATGCT TTGGGTTCCG GATTCATTAT CGACCAGTCC 
GGTTTGATTC TCACGAACAA TCACGTCGTG GAGAAAGCTG ACGAAATCAA GATCAAAACG 
CTCAGCGGAA AGGAATACGA CGCGAAAGTG GTCGGACGCG ACTCCAAGAC CGATATCGCC 
CTGATCAAGG TCACGCCCGA CACGGATTTC CCGAAGCCCG CGCAGCTTGG CAATTCGGAC 
GCCATCCGAG TGGGCGACTG GGTGATGGCG GTGGGAAATC CTTTCGCTCT GGGCCACACC 
GTGACCGCGG GCATCATCAG CGCCAAGGGC AGGGTCATCG GGGCGGGCCC CTACGACGAT 
TTCCTTCAGA CCGATGCGGC GATCAACCCC GGGAACAGCG GCGGCCCCCT CTTCAACATG 
AACGCTGAAG TGGTCGGCCT CAATACGGCC ATTGTAGCCC ACGGGCAGGG CATCGGGTTT 
GCCACCCCCA TCAACGTGGC CAAAGACATT CTGGAGCAGC TAAAATCCGG CAAGGTGGTT 
CGAGGCTGGC TCGGGGTCAT GATCCAGGAC ATCACGCCCG AACTGGCCGA GTCGTTCGGT 
ATCAAGGAGA CCAAGGGAGT CATCGTCGCC GACGTGGTGC CGGACGCTCC GGCTGAAGCC 
GCGGGCATCA AGCGCGGGGA CGTCATCACT TCGGTCAATG GGAAAGAAAT CGACAATGCC 
CCCGCACTCT CCAGGTACAT CGGTTTCAGC GCTCCCGGAA CCCCGCTTTC GCTGCAGATC 
ATCCGGGACG GCAAACCCAT GTCGATCAAG GTGTCCAGCG GAACCATGCC CGACGAAGGC 
AAGGAAGCCA AAGTCGAAAA AAAGGAAAGC CTCTGGGGCA TGGTCGTTCA GAATATCACA 
CCGGAAATCG CTCAGCGCTT CGGATGGGAT GAAAACGAAC GCGGCGTCGT CATCACCGAA 
GTAAAGCCGG GAAGCCCCGC CGGCGAAGCC CGGTTGCGCC CGGGAGATCT GATCAAGGAA 
GTCAACCGGC AGAAGATTCA GAACATCAGG GATTACAACC AGGCCGTTCA GAAGCCTCAG 
CGGGGCCAGA CCATGCTGCT GCTCGTGAAG AGGGGCAAGA ATACGTTTTT TGTCTCGCTG 
AAGTCGACTC AGGAGTAG

Protein sequence

MEVFRTGKAG IVFRWIRLFT FVVALPCFLL LSQSIPSAHG AAWQQGPPSF ADLAEQVKHA 
VVNISTTQVL KESPMQQFMG PNSPFRDFFD DDFMKRFFGE QPQGQRKGHA LGSGFIIDQS 
GLILTNNHVV EKADEIKIKT LSGKEYDAKV VGRDSKTDIA LIKVTPDTDF PKPAQLGNSD 
AIRVGDWVMA VGNPFALGHT VTAGIISAKG RVIGAGPYDD FLQTDAAINP GNSGGPLFNM 
NAEVVGLNTA IVAHGQGIGF ATPINVAKDI LEQLKSGKVV RGWLGVMIQD ITPELAESFG 
IKETKGVIVA DVVPDAPAEA AGIKRGDVIT SVNGKEIDNA PALSRYIGFS APGTPLSLQI 
IRDGKPMSIK VSSGTMPDEG KEAKVEKKES LWGMVVQNIT PEIAQRFGWD ENERGVVITE 
VKPGSPAGEA RLRPGDLIKE VNRQKIQNIR DYNQAVQKPQ RGQTMLLLVK RGKNTFFVSL 
KSTQE