Gene Acel_1904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1904
Symbol
ID	4485551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	2150384
End bp	2152030
Gene Length	1647 bp
Protein Length	548 aa
Translation table	11
GC content	66%
IMG OID	639730695
Product	peptidase S8/S53 subtilisin kexin sedolisin
Protein accession	YP_873662
Protein GI	117929111
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG1404] Subtilisin-like serine proteases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAGTCG CGGCAACAAT CGCCCGCGGC GTCACCTGGG GAGACAGCAG GTGGCGGAGA 
TTCGCGGCGG CATTCGCCAG CGCGGCGTCG ATCGTGGGAT TCCTACCCGT GATCGGAGTG 
ACGGGGACGG CGGAAACCCG GCCGTTCGTG TCAGCCGGCG AGTCGTCGTA CATCGTGCGG 
GCGACACCAG GTCACCTCGA CGAGGCTCGA GCCGCGATCG GCTCGGTAGG CGGGCGCGTC 
GGCGTGGACC TCTCCATCAT CAACGGTGTG CAGGCCGTTC TCACCGCCAG TGAGGCACGA 
AGCCTGGCAA ACCATCCGGG AATTCTCTCG GTAACGCCCG ATTTCGGGGC AAAACTCCAG 
GGTTCGAGTT ACGACCCAAA CACTGACGCC GGCGGTCCGG TCGGACTCTC CTCCATCGTC 
GGCTACAACG CATACTGGAA TGCCGGCTTC TCGGGTCAAG GCATTGGAGT CGCGCTCATC 
GATTCCGGTG TCGTCCCGGT ACCGGCACTC TCGGCACCCG GCAAGATCAT ATACGGTCCA 
GACTTCACGC CGACCGGGTA CTTCACCGAG GTACGAGGCC TGGACACCTT CGGCCACGGC 
ACATTCATGG CCGGGCTGAT CGCCGGTCGC GATCCGGGAG CAACCGCGCC GTACTGGGCC 
AACAGTGGGT ACTACTTAGG CGTCGCCCCG GACGCGAACA TCATCAGCGT CAAGGTGGCC 
GATGCGAGTG GTGCGACCAT GGCATCCGCG GTGATCGCAG CCATCCAGTG GGTCGTCGCA 
CACCGCAATG ACCCCGGCCT GAACATCAAG GTGCTGAACC TGTCGCTCGG GGTGCGGGAC 
GGCCTGCCCT ACCAGCAAGA CCCGCTGGAC GCCGCCGTCG AAGCGGCCTG GAAGGCCGGC 
ATCACCGTCG TCGCGGCGGC CGGGAATGAC GGCCAGGTCG GCATGACCGC ACCGGCGAAC 
GATCCGTACG TCATCGCGGT CGGTGCGATC GACACGAATT CCACCCTCTC GGTCTCCGAC 
GACACTGTTG CGAGTTTCTC GAACATCGGC GACGGGACTC GCAATCCCGA CTTCGTCGTT 
CCGGGCACGC ACATCGTCGG TCTACGCGAC CCCGGGTCGG CCATCGACCA GGAGTACGGT 
AACGGCCCCG GATCCATCAA CGCCTCGCTG ATGCGCGGCA GCGGAACGTC GGAGGCCGCG 
GCCATCACCT CCGGCGCGGT GGCGTTGCTC CTGTCGCAGC GCCCGAACCT CACCCCGGAC 
CAGGTGAAAG CGACCCTCGT CATCCACTCC AGCTGGAACC TGCCGCAGCA GCAAGCGGGT 
GCCGGGGCGC TGAACATGGC CTGGGTGCTC AATGCGGCCA CCGAGTACCG CACCCAGAAC 
TGGCCCAGTG CGACCGTGAG CAACGCGGCG TCACCGACGA CGAGCGCCGG CTGGAGCCTC 
ACGCCGTCCC GCTCGACCTG GACCGGTTCG ACCTGGACGT CGGTGGACTT CACGCGTTCG 
ACCTGGACCG GCTCCACCTG GACCGGCTCC ACCTGGACCC GGTCAACCTG GACCGGATGC 
ACCTGGACTG GTTCGACCTG GACTGGTTCG ACCTGGACCG GCTCCACCTG GACCCGGTCA 
ACCTGGACCA ATTACTCATG GTCCTGA

Protein sequence

MSVAATIARG VTWGDSRWRR FAAAFASAAS IVGFLPVIGV TGTAETRPFV SAGESSYIVR 
ATPGHLDEAR AAIGSVGGRV GVDLSIINGV QAVLTASEAR SLANHPGILS VTPDFGAKLQ 
GSSYDPNTDA GGPVGLSSIV GYNAYWNAGF SGQGIGVALI DSGVVPVPAL SAPGKIIYGP 
DFTPTGYFTE VRGLDTFGHG TFMAGLIAGR DPGATAPYWA NSGYYLGVAP DANIISVKVA 
DASGATMASA VIAAIQWVVA HRNDPGLNIK VLNLSLGVRD GLPYQQDPLD AAVEAAWKAG 
ITVVAAAGND GQVGMTAPAN DPYVIAVGAI DTNSTLSVSD DTVASFSNIG DGTRNPDFVV 
PGTHIVGLRD PGSAIDQEYG NGPGSINASL MRGSGTSEAA AITSGAVALL LSQRPNLTPD 
QVKATLVIHS SWNLPQQQAG AGALNMAWVL NAATEYRTQN WPSATVSNAA SPTTSAGWSL 
TPSRSTWTGS TWTSVDFTRS TWTGSTWTGS TWTRSTWTGC TWTGSTWTGS TWTGSTWTRS 
TWTNYSWS