Gene Rcas_0521 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_0521
Symbol
ID	5537984
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	679575
End bp	680936
Gene Length	1362 bp
Protein Length	453 aa
Translation table	11
GC content	62%
IMG OID	640892683
Product	Beta-glucosidase
Protein accession	YP_001430669
Protein GI	156740540
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAATAC GACACTTCCC CGACGATTTT CTCTGGGGCG CTGCGACGGC TGCCTTTCAA 
ATCGAAGGCG CCACCCGCGA AGATGGACGC GGCGAGTCGA TCTGGGACCG GTTCTGTGCA 
ACGCCAGGCA AGGTGCTCAA CGGCGACACC GGCGATCCCG CCTGCGATCA CTACCACCGT 
TGGCGCGACG ACATCGCGCT CATGAAATCA CTCGGCTTTC CGGCATATCG GTTTTCAATC 
GCCTGGTCCC GTATTATGCC CAAGGGGAGA GGCGCAGTCA ATCCTGCCGG TCTCGATTTT 
TACGACCGCC TGGTTGATGG TTTGCTGGCA GCAGGCATTC GCCCGTTTGT GACATTGTAC 
CACTGGGATC TGCCACAGGC GCTCGAAGAT GCTGGCGGTT GGCCCGCGCG CGATACCGCC 
GCTGCGTTCG CCGACTATGC CGATGTTGTG GCGCGACGCC TGGGGGATCG TGTGAAACAC 
TGGATCACGC TCAACGAACC GTGGTGTTCC GCATTTCTCG GCTATTGGAC CGGTGATCAC 
GCGCCGGGGC GGAAGGAAGG ACCGGCGCTT GCTGCGGCGC ACCACCTGCT CCTCGGTCAT 
GGGCTGGCGC TCGCCGCTCT TCGCGCTGCA CACTCCGACG TTCGGGCGGG CATTACTCTC 
AACTTTTCGC CTGCTGACCC GGCGAGTGAT AGCGATGCGG ATCGCGCGGC GGCGTGGCGG 
TACGATGGCT TTTTCAACCG CTGGTACCTC GATCCGCTCT ATCGCAGCGC CTATCCCGCC 
GACATGCTGG CGCTCTATGC GCAGATGGGG CAGGCGCCGC CGGTGCAAGA CGACGATATG 
CGCATCATCG CTGCGCCGCT CGATTTTCTG GGGGTGAACT ACTACTCGCG CGCCGTCATT 
CGCGACGATC CGCAGGCTGG CGGTCTCAGG TACGCACACA AGCGACCGGA AGGCGAGTAC 
ACCCAGATGG ATTGGGAAGT TCATCCCGCT TCGCTGCGCC GACTGCTGGA GCGATTGCAC 
CGTGATTACG CGCCGACGAC GCTGTACATA ACTGAAAACG GCGCCGCCTA TCCAGACGAA 
GTCTCATCCG ACGGCGGCGT CCACGACCCG GATCGCGTGC GCTACATCGC GCGTCATCTG 
GCGGCATGCC ACGATGCCAT CGCTGCCGGA GTTCCGCTGC GCGGATACTT CGTCTGGTCG 
TTAATGGACA ACTTCGAGTG GGCATTCGGT TATAGCCGCC GATTCGGTAT TGTGTACGTG 
GACTACGCCA CTCAGCGGCG CATTCCAAAG GACTCGGCGC TGTTCCTGCG CCAGGTGATC 
GCCGCAAATG CGTTGACAGA GACGCAGATG TTTACGAGGT GA

Protein sequence

MAIRHFPDDF LWGAATAAFQ IEGATREDGR GESIWDRFCA TPGKVLNGDT GDPACDHYHR 
WRDDIALMKS LGFPAYRFSI AWSRIMPKGR GAVNPAGLDF YDRLVDGLLA AGIRPFVTLY 
HWDLPQALED AGGWPARDTA AAFADYADVV ARRLGDRVKH WITLNEPWCS AFLGYWTGDH 
APGRKEGPAL AAAHHLLLGH GLALAALRAA HSDVRAGITL NFSPADPASD SDADRAAAWR 
YDGFFNRWYL DPLYRSAYPA DMLALYAQMG QAPPVQDDDM RIIAAPLDFL GVNYYSRAVI 
RDDPQAGGLR YAHKRPEGEY TQMDWEVHPA SLRRLLERLH RDYAPTTLYI TENGAAYPDE 
VSSDGGVHDP DRVRYIARHL AACHDAIAAG VPLRGYFVWS LMDNFEWAFG YSRRFGIVYV 
DYATQRRIPK DSALFLRQVI AANALTETQM FTR