Gene Gobs_0234 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gobs_0234
Symbol
ID	8751883
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geodermatophilus obscurus DSM 43160
Kingdom	Bacteria
Replicon accession	NC_013757
Strand	-
Start bp	244887
End bp	246155
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	76%
IMG OID
Product	1, 4-beta cellobiohydrolase
Protein accession	YP_003407410
Protein GI	284988856
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGGAAT CGGTCCACTA CTTTACGTGC ATGCCCGTCG TCACCACCGC GCCGCCCAGT 
ACCTCCGGCC GGCACCGGCC AGGTCGCGGC AGGCGACTGC TGTGGACGTC CGGGCTCGCC 
GCGGCACTGG TCGGCACCGG CCTGGTCACG CCGCTGCTCA CCGGTCCCGA GGCGACGCCG 
GCCGCGCAGC CGGCCATCGA GCAGGTCCGC AAGGTCCGAC CGGCGCCGAC GACGACGGCT 
CCGGCTCCGG CTCCTGCCAT CGCCAGCCCC ACGACGAGCG CTCCCGCGCC GAGCAGCACG 
ACGACCGCCG CGCCCTCGAC GCCCGCGAGC GCCGCTCCGA CGAGCAGCTC CGCCGCCGGT 
GCGCCGAGCA CCACGACGCC CGCCGCACCG ACCTCGACCG CCGCCCCGGC CCCCTCGACG 
GCCAACCCGC TCGCCGGGAT GACCTTCCAC GGCCCCAACA CCGGTGCGGC CCTGGCCGCG 
GCGCAGCCGG GCCGCAGCCC CGAGGACGCC GCGGCGCTCG CCCAGCTGGC GGGCGTGCCC 
ACGGCGACCT GGCTGGGGGC GTGGAGCGGA GACGTCACGG CGGCGGTCCG CCAGGAGGTC 
ACCGCCGCCC GCGCGGCCGG GGCCGTGCCG GTCCTCGTCA CGTACAACGT CCCGGGCCGG 
GACTGCGGCG GCTACTCAGC CGGGGGCGTG GACTCGTCGG CCGAGTACCT CCGCTGGGTG 
CAGGCGGTCG CGGCCGGCAT CGGGACCGCG CAGGCGGTGG TGGTCGTCGA GCCCGACGCG 
CTCGCGCTGC TGTGCGGCGA CCCGGCGCAG CGCCTGTCGC TGCTGCGGTC GGCAGTCGAG 
GTGCTCGAGG CCAACGCCGG CACCCACACC TACCTCGACG CCGGGCACTC GACCTGGATC 
GACGCCGCGA CGATGGCCGA GCGGCTTCGC GCCGCCGGGG TGACCGCCGC GGACGGCTTC 
GCGCTGAACG TCTCCAACTT CCAGACGACC GCGAGCAACG TGGCCTACGG CCATCAGGTG 
TCGTCGCTGC TGGGCGGCGC CCACTTCGTC GTGGACACCA GCCGCAACGG CAACGGCCCC 
GGCAGCGACT GGTGCAACCC CCCGGGCCGC GCCCTCGGCG AGCGCCCGAC GGCGCAGACC 
GGGCAGCCCC GGGTCGACGC GTTCCTGTGG GTCAAGCGAC CCGGCGAGTC CGACGGCACG 
TGCAACGGCG GCCCGGCCCC CGGGACCTTC TGGGACGCCT ATGCCATCGG GCTGGTCCGG 
GGCTACTGA

Protein sequence

MKESVHYFTC MPVVTTAPPS TSGRHRPGRG RRLLWTSGLA AALVGTGLVT PLLTGPEATP 
AAQPAIEQVR KVRPAPTTTA PAPAPAIASP TTSAPAPSST TTAAPSTPAS AAPTSSSAAG 
APSTTTPAAP TSTAAPAPST ANPLAGMTFH GPNTGAALAA AQPGRSPEDA AALAQLAGVP 
TATWLGAWSG DVTAAVRQEV TAARAAGAVP VLVTYNVPGR DCGGYSAGGV DSSAEYLRWV 
QAVAAGIGTA QAVVVVEPDA LALLCGDPAQ RLSLLRSAVE VLEANAGTHT YLDAGHSTWI 
DAATMAERLR AAGVTAADGF ALNVSNFQTT ASNVAYGHQV SSLLGGAHFV VDTSRNGNGP 
GSDWCNPPGR ALGERPTAQT GQPRVDAFLW VKRPGESDGT CNGGPAPGTF WDAYAIGLVR 
GY