Gene Noca_4587 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4587
Symbol
ID	4598685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4856993
End bp	4858390
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	71%
IMG OID	639779196
Product	Beta-glucosidase
Protein accession	YP_925769
Protein GI	119718804
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.349984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCCCCCG CGTCCCCCGA CAGCTCCCCC GGCAGCCGCT CCGGCAGCCC TGCGGGCAGC 
TCCCTCCCGC AGCTCCCTCC CGGCTTCCGG TTCGGCACCA GCACGGCGTC GTACCAGATC 
GAGGGCGCGG CGACGGAGGA CGGCAAGGGC CCCAGCGTGT GGGACACCTT CACCGCCGAG 
GAGGGCCGGA TCGTCGACGG CTCGAGCGGA GCGGTCGCGT GCGACCACTA CCACCGCTAC 
GGCGAGGACG TGGCGCTGAT GAAGCGCCTG GGCGCCGGCG GCTACCGCTT CTCGCTGTCC 
TGGCCGCGGA TCCAGCCCAC CGGCTCGGGT CCGGCGAACC CGAAGGGCCT GGACTTCTAC 
GACCGCTTGA TCGACGAGCT GCTCGCCAAC GGCGTGCAGC CGATGGCCAC CCTCTACCAC 
TGGGACCTGC CCCAGGCGCT CGAGGACGAC GGCGGCTGGC TGAACCGCGC CACCGTCGAC 
CGCTTCGCGG AGTACGCCGC GATCGTCGGG GAGCGGTTCG CCGACCGGGT CGAGCACTGG 
ATCCCCGTCA ACGAGCCCAA CGTCGTGATG ATGATGGGCT ACGCGGTCGG CTTCCAGGCG 
CCCGGCCGGA CGCTGATGTT CGACTCGATG CCGGTCGCCC ACCACCTGCT GCTCGCGCAC 
GGCCGCGCCG CAGTCGAGCT GCGCGCCGCC GGCGCCACCA GCATCGGCTG CGCCAACAAC 
CACTCGCCGA TGTGGCCGGC CAGCGACGAC GAGGCGGACG TCGGTGCGAC CAAGCTCTTC 
GACGCGTTGT GGAACGGCAT GTTCACCGAG CCGATGCTGC TCGGCCGCTA CCCCGCCGAC 
CTGCAGCCGC TGATGGCCGA CGTGGTCTGC GACGGCGACC TGTCGGTGAT CCGCCAGCCG 
CTCGACTTCT ACGGCGTCAA CTACTACCAC CCGTTCAAGA TCGGCGCCGC CCGCGAGGAC 
GCCGAGATGC CCTTCGAGTT CCGCGAGCTG GTCGGCTACC CGACCACGGA CTTCGGCTGG 
CCGGTGGTGC CCGACGCGTT GCGCGAGTGG CTGATCACGC TGCGGGCCCG CTACCGGGCC 
GCGCTACCGC CGATCTACAT CACCGAGTCC GGCTGTTCCT ACAACATGGG CCCCGACGAG 
TTCGGCGTCG TCGACGACCA GCCGCGCATC GACTACCTCG ACGCCCACCT GCGGGCGGTC 
GCGACCGCCT GCCAGCGCGG CGTCGACGTA CGCGGCTACT ACACGTGGTC GCTGATGGAC 
AACTTCGAGT GGTCCGAGGG CTACACCCAG CGCTTCGGCC TCGTGCACGT CGACTTCGAC 
ACCCAGGTGC GCACCCCCAA GCGCTCCTTC CAGTGGTACG CCGACGTGAT CGCCCGGCAG 
ACCCGCTCCG TGGGCTGA

Protein sequence

MPPASPDSSP GSRSGSPAGS SLPQLPPGFR FGTSTASYQI EGAATEDGKG PSVWDTFTAE 
EGRIVDGSSG AVACDHYHRY GEDVALMKRL GAGGYRFSLS WPRIQPTGSG PANPKGLDFY 
DRLIDELLAN GVQPMATLYH WDLPQALEDD GGWLNRATVD RFAEYAAIVG ERFADRVEHW 
IPVNEPNVVM MMGYAVGFQA PGRTLMFDSM PVAHHLLLAH GRAAVELRAA GATSIGCANN 
HSPMWPASDD EADVGATKLF DALWNGMFTE PMLLGRYPAD LQPLMADVVC DGDLSVIRQP 
LDFYGVNYYH PFKIGAARED AEMPFEFREL VGYPTTDFGW PVVPDALREW LITLRARYRA 
ALPPIYITES GCSYNMGPDE FGVVDDQPRI DYLDAHLRAV ATACQRGVDV RGYYTWSLMD 
NFEWSEGYTQ RFGLVHVDFD TQVRTPKRSF QWYADVIARQ TRSVG