Gene Noca_4617 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4617
Symbol
ID	4596073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	+
Start bp	4891817
End bp	4892842
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	72%
IMG OID	639779226
Product	cellulase
Protein accession	YP_925799
Protein GI	119718834
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG5297] Cellobiohydrolase A (1,4-beta-cellobiosidase A)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTCCCAC GGCCCCGCCT GCTGCGCGCC GCGGCGCTGT TGACGGCCCT GGCGCTCGGC 
GCCGGCCTCG CCGCGCCGGC CGGTGCCGAC CCCGTCGCAC CGGACGGGTC GCTCGCCGCG 
AAGGGCCAGG ACCCGCGCAA GACCCGCGGG CTGTTCGTCG ACCCGTACAT GCCCGCCGCC 
ACCCAGCAGG AGCAGGTGTA CCGCGAGCAG ATCGGCTCGA AGGCGCAGAC ACTGTGGATC 
ATCCCCGAGG CCTACCCGAC CTCCGAGGTC CGCAGCGTCG TCCGCGCCTA CACCAGGCGT 
GCACTGGCCG CGCGGAAGAC GCCGATGCTC ACCGTCTACG GCATCCCGGG CCGCGACTGC 
GGGCAGTACT CCTCGGGCAA CCCGCTGACC ACGGCCGCGC AGTACCGCAC CTGGATCCGG 
CGGATCTCCG GCGGCCTGGA GGACCAGCAC GCGCTCGTCG TGCTCGAGCC GGATGCGCTA 
CCCCTGTTCA GCAGCTCGCA CGACGCCTGC CCTACCAAGC CGGACGGCTG GCAGGGCATG 
CTGCGCTTCG CGAGCCGGCG CCTGAGCGGC TCCGGGGCGT GGGTCTACCT CGATGCGGGG 
CACTCGAACT GGACGCCGTA CGACACCCGG CCGAGATTCC TGAGGAACAG CGGCATCGGG 
TACGCGCGTG GCTTCAGCAC CAACGTGTCG AACTTCCGCC CGACTGTCGA CGAGAAGCAG 
TACGCGGCCT TCCTGTTGCG CGGACTGCGC AAGCTCGGAG TCCGCGGAAA GCACTACGTC 
ATCGACACCT CGCGCAACGG CGCCACCCCG AGCGCGGACG GGTACGACGT GATCAACCCG 
ACCTGGGCGC GCATCGGCCG CCCGCCACGG CTGGTCTTCG ACGGCGCCTT CGACGGCACG 
CTGTGGGTCA AGCACCCCGG CGAGTCCGAC GGCACGAAGA ACGGCGGGCC CCCGTCGGGT 
CAGTGGTGCG ACTTCCTCGC CGACCGGCTG CTTGGTGAGC CGGAGTCGAG CAGCTGCGAA 
CCCTGA

Protein sequence

MLPRPRLLRA AALLTALALG AGLAAPAGAD PVAPDGSLAA KGQDPRKTRG LFVDPYMPAA 
TQQEQVYREQ IGSKAQTLWI IPEAYPTSEV RSVVRAYTRR ALAARKTPML TVYGIPGRDC 
GQYSSGNPLT TAAQYRTWIR RISGGLEDQH ALVVLEPDAL PLFSSSHDAC PTKPDGWQGM 
LRFASRRLSG SGAWVYLDAG HSNWTPYDTR PRFLRNSGIG YARGFSTNVS NFRPTVDEKQ 
YAAFLLRGLR KLGVRGKHYV IDTSRNGATP SADGYDVINP TWARIGRPPR LVFDGAFDGT 
LWVKHPGESD GTKNGGPPSG QWCDFLADRL LGEPESSSCE P