Gene Snas_2947 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_2947
Symbol
ID	8884146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	3105924
End bp	3107282
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	65%
IMG OID
Product	Cellulose 1,4-beta-cellobiosidase
Protein accession	YP_003511715
Protein GI	291300437
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000458427
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00017321
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCCAAC TCAGACGTTA TTGGACGCGG TTCGCCGTGA TGTTGTTGTC GATCGGGGCG 
GTGCTGGTGT CTGGTTCTAC GGCCAGCGCT ATCCCTGCCG ACGGCCCGGC AGTTCAGGCT 
CGCGTCGACA ACCCGTATGC GGGGGCTCGG CCTTACGTAA ATCCGGAATG GTCGGCCAAA 
GCGGCCGCCG AGCCCGGTGG CAGCGCCATC GCGGACCAGC CGACCGGCGT GTGGCTGGAC 
CGCATCGCCG CCATCGAGGG CGCGGGCAGT GCCATGGGCC TGCGCGATCA CCTGGACGCG 
GCCCTCGCCC AGGACGCGAA CCTGGTGCAG CTGGTCGTGT ACGACCTTCC TGGACGCGAC 
TGTTCCGCAC TGGCTTCGAA CGGAGAACTC GCTCCCGACG AGATCGGCAG GTACCGCGAC 
GAGTTCATCG ATCCGATCGC GGCGATTCTC GCCGACCCGG CCTACGCGGG GTTGCGCATC 
GTGACCGTTG TGGAGATCGA TTCGCTGCCC AACCTCGTGA CGAATGTCAG CCCGCGTCCC 
ACGGCGACGC CGGAATGCGA TGTGATGGCC GCGAACGGCA ATTACGTCAA CGGCATCGGT 
TACGCGCTGC GGCAGTTCGG CGCGATCGAC AACGTCTACA ACTACCTGGA TGTCGGCCAT 
CACGGTTGGC TGGGTTGGGA TGACAACTTC GCGCCCGGTG CACGGAAGTT GCTGGAGGGC 
GCTCAGGCTT CCGGCAGCGT GGACAATGTC CACGGGTTCA TCACCAACAC CGCCAACTAC 
GGTGCCCTCA AGGAGCCGTA CTTCACGATC AATGACACCG TGAACGGCCA GACCGTGCGC 
CAGGCGAAGT GGATCGACTG GAACCGTTAC GTGGACGAGC TGTCCTACGC GCAGGCGTTC 
CGCGCCGAAC TGGTCCGGAT CGGCTTCAAC TCGGATATCG GCATGTTGAT CGACACCGGC 
CGTAACGGCT GGGGTGGTTC CGCGCGTCCG GCCGGGCCTG GCCCGACTAC TTCGGTGGAC 
GCTTATGTCG ATGGTGGACG CCTCGATCGC AGGATCCACC TCGGTAACTG GTGCAACCAG 
TCCGGGGCCG GGCTGGGGGA GCGTCCTACC GCCGCTCCCG AGTCGGGGAT CGACGCTTAT 
GTGTGGATGA AACCGCCGGG CGAGTCCGAC GGTTCCAGCA AGGAGATCCC CAACGACGAG 
GGCAAGGGCT TTGACCGGAT GTGCGATCCG ACTTATGAGG GGAACATCCG CAATGGGTTC 
AACCCGCCCG GATCGCTTCC CGACGCCCCG CTGTCGGGGC ACTGGTTCGG CGCGCAGTTC 
CGTGAGCTGC TGGCCAACGC CCATCCGCCG CTGACCTGA

Protein sequence

MSQLRRYWTR FAVMLLSIGA VLVSGSTASA IPADGPAVQA RVDNPYAGAR PYVNPEWSAK 
AAAEPGGSAI ADQPTGVWLD RIAAIEGAGS AMGLRDHLDA ALAQDANLVQ LVVYDLPGRD 
CSALASNGEL APDEIGRYRD EFIDPIAAIL ADPAYAGLRI VTVVEIDSLP NLVTNVSPRP 
TATPECDVMA ANGNYVNGIG YALRQFGAID NVYNYLDVGH HGWLGWDDNF APGARKLLEG 
AQASGSVDNV HGFITNTANY GALKEPYFTI NDTVNGQTVR QAKWIDWNRY VDELSYAQAF 
RAELVRIGFN SDIGMLIDTG RNGWGGSARP AGPGPTTSVD AYVDGGRLDR RIHLGNWCNQ 
SGAGLGERPT AAPESGIDAY VWMKPPGESD GSSKEIPNDE GKGFDRMCDP TYEGNIRNGF 
NPPGSLPDAP LSGHWFGAQF RELLANAHPP LT