Gene Noca_3384 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_3384
Symbol
ID	4598182
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	3586037
End bp	3587932
Gene Length	1896 bp
Protein Length	631 aa
Translation table	11
GC content	74%
IMG OID	639777991
Product	glycoside hydrolase family 3 protein
Protein accession	YP_924572
Protein GI	119717607
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1472] Beta-glucosidase-related glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCAGCCC GGCCGAGCGC CGCCACCCGT CGCCGCAGGA CCGCCGTCCG GACCCTCGGT 
GCGGGCTTGA TCCTGCTGCT CGCCGCAGCG TTCGGGCCGA CCTTGTCGCC ACCCCCGGCG 
ACCGCCGCTG TCGGGGACCG AGCCGCCGCC GGCCCGTCGT ACGACCGGGC GCGCACCGCG 
CTGGCGCAGC TGACGCGCAA GCAGAAGGTC GGGCAGCTGT TCGTGATCGA GGTCGCCGGT 
CGTGACGCCA ACGACGTGAG CGACGCGGCG AAGGCGGTCA ACCAGAGGCT GTACGGCGTC 
GACACCCCGG CCCAGGCGAT CGCGAAGTAC CAGCCCGGCG GGGTCATCTA CTTCACCACC 
CGCAACGGGG ACGACAACAT CGGTACGCCG GAGCAGGTGG CCAGGCTGTC GAACGGGCTG 
CAGGCCGCGG CGCGGGCGCT GCCGGGCGGG ATCCCGCTGC AGATCTCGGT CGACCAGGAG 
GGCGGTGCCC TCGTGGCGCG CTTCGGCGCG GCGTCGGGAG CCACGCAGCT GCCGGGGAAC 
ATGGCGCTCG GTGCGGGCGC GCTCGGGACC GGAGGGTCGG CGGCGGACGC CCGCCGCTCG 
GCGACCGTGA TCGGCGCCGA GCTCGCGGCG GTCGGGGTGA CGCAGGACTA CGCGCCGGTC 
GCGGACGTGA ACGTGAACCC GAACAACCCG GTGATCGGGA TCAGGTCCAT CGGCTCCGAC 
CCGGCGCTGG TCTCCGACCT GGTCGCCGCC CAGGTCCGCG GCTTCCACCG CGGCGGAGTC 
TCCGCGGTCG CGAAGCACTT CCCGGGACAC GGGGACACGG GCGTGGACAG CCACTTCGGG 
CTGCCCGAGG TGACGCACAC GCGGTCGCAG CTGGAGGAGA TCGACCTGCC GCCGTTCCGT 
GCAGCGATCG CCGCCGGGGT CGACACGATC ATGACCGCGC ACGTCGTGCT GCCGGCGATC 
GACCCGGGTG TCCCCGCGAC GATGTCGCGG AAGATCCTCA CCGGGCTGCT GCGCCGCGAG 
CTGGGCTTCG ACGGGCTGAT CGTGACCGAC GCGCTGGACA TGGGTGGCGC GACGGCGACG 
TACCCGCCCG ACGTGGCGCC GGTGCGGGCG CTGCTCGCCG GCGCCGACCA GCTGCTGATC 
CCGCCCGAGA TGGACACGGC GTACCGCGCG GTGCTGAAGG CGGTGCGCAG CGGGCAGATC 
AGCAGGGAGC GGCTCAACGA GTCGGTGTAC CGGATCCTGC TGCACAAGTA CGAGCGCGGG 
CTCTTCGGCG ACCCGTACGT CGACCGGGCC GCGGCGGCGG GGATCGTGGG CGCCCCGACG 
CACCTCGCGA CCGCGCAGGC GATCACCGAC CGCACGACGA CGCTGCTCAA GAACGACGCC 
GGGCTGCTGC CGCTGACCGC CGGGCCGCGG CAGGTCCTGG TCGCCGGGTG GGGCGCGACG 
ACGACGCAGA CGCTCGCGAC GGCGCTCGGC ACCCGCGGCG CCACGACGCA GGTCCTCGAG 
TCCGGCACCA CGCCCTCGGA CGCGGCGATC GAGGACGCCG TCGCGGCGGC GCAGGACGCC 
GACCTGGTCG TCGTGACGAC GAACAACGCG TACGCCGTCG ACGCGTCGAC CGGGGCACCG 
ACCAACGCCG CGGCCGCGCA GACCCGGCTG GTGCGCGCCC TGCTCGAAAC GGGTAGGCCG 
GTCGTGGTCG CCGCCGTGCG CAACCCGTAC GACGTCGCCT CGTTCCCCTC GGCGCCGACG 
GTGCTGGACA CCTACGGCTA CACCGCGGCC CAGGTCGAGT CGCTGGTCCG GGTGCTGTTC 
GGCGAGGTCG AGCCGACCGG CCGGCTGCCG GTCGCGATCC CCGGCCCCAA CGGCACCGGC 
GAGCTCTTCG AGCTCGGCCA CGGTCTGGGC TACTGA

Protein sequence

MPARPSAATR RRRTAVRTLG AGLILLLAAA FGPTLSPPPA TAAVGDRAAA GPSYDRARTA 
LAQLTRKQKV GQLFVIEVAG RDANDVSDAA KAVNQRLYGV DTPAQAIAKY QPGGVIYFTT 
RNGDDNIGTP EQVARLSNGL QAAARALPGG IPLQISVDQE GGALVARFGA ASGATQLPGN 
MALGAGALGT GGSAADARRS ATVIGAELAA VGVTQDYAPV ADVNVNPNNP VIGIRSIGSD 
PALVSDLVAA QVRGFHRGGV SAVAKHFPGH GDTGVDSHFG LPEVTHTRSQ LEEIDLPPFR 
AAIAAGVDTI MTAHVVLPAI DPGVPATMSR KILTGLLRRE LGFDGLIVTD ALDMGGATAT 
YPPDVAPVRA LLAGADQLLI PPEMDTAYRA VLKAVRSGQI SRERLNESVY RILLHKYERG 
LFGDPYVDRA AAAGIVGAPT HLATAQAITD RTTTLLKNDA GLLPLTAGPR QVLVAGWGAT 
TTQTLATALG TRGATTQVLE SGTTPSDAAI EDAVAAAQDA DLVVVTTNNA YAVDASTGAP 
TNAAAAQTRL VRALLETGRP VVVAAVRNPY DVASFPSAPT VLDTYGYTAA QVESLVRVLF 
GEVEPTGRLP VAIPGPNGTG ELFELGHGLG Y