Gene Noca_0056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_0056
Symbol
ID	4600107
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	62748
End bp	63995
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	68%
IMG OID	639774670
Product	glycosyl hydrolase family 32 protein
Protein accession	YP_921292
Protein GI	119714327
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGGCCCC TGGTCCACTT CACTGCAGAC GCCGGCTGGA TCAATGACCC CCACGGCCTG 
ACCTTCCACC GCGGCCGGTA TCACCTGTTC CACCAGTACG TCCCCGAGAG CATGGTGTGG 
GCGCCCAACT GCCATTGGGG CCACGCCACG AGCTCGAACC TCCTCACGTG GACGCGGCAC 
CGGGTGGCGA TCGCCCCTGG AGACGGGGAC GACGGCATCT GGACGGGAAG CCTCGCTCTG 
ACGGGCCAGG ACGCCACCAT CCTCTACACC TCGGTCGCCC AACCGGACCT CGGCTTGGGT 
CGCGTCCGCC TCGCCACCCC GGCCGACGAC TCGTGGGAGA TCTGGAGCAA GGGTGACATC 
GTCGTCACCC CTCCCGACGA GCTCGATCTG ATCGCATTCC GCGATCCCTT CGTCGTTCGC 
GACGCGGCGG GCTGGCGCAT GTTCATCGGC GCGGCGACGC GGGAGGGTGA CGCGCTCGCC 
CTCACCTACA CCTCGCCGGA CCTGTCGTCC TGGATCTATG AGGGCATCGC CCTCCAGAGG 
TCCACGAAAG AGAAGGACCC GGTGTGGATG GGAGCGCTCT GGGAATGCCC CCAGGTCTTC 
GAGGTCGACG ACCACTGGGT GATGGTGAGC TCCGTCTGGG ACAACGACGT GCTGCACTAT 
GCCGGCTACG CCCTTGGCGA CCGCGACTCC TACAGCGCGG GAAAGCTGAT GCCGACCGAA 
TGGGGTCAAC TCAGCTTCGG TGACTCCTAC TACGCCCCGT CCTACTTCCT CGATGAGGAC 
GAGCTTCCGT GTCTGATGTT CTGGATGCGC GGCGTGAGCG ATGCAGACGA CGGCTGGGCG 
AGCTGCCTGA GCCTGCCCTA TTCCTTGACC GTCCGCGATG ACCGGCTCGT CGCCGAGCCT 
CACGCCGCGC TCGCCGAGGC GCGCGGCGAC GCGTTGGCGG CGGGTGCCGA CGCCCGCGCC 
TACGACCTGG AGTGGGACCC GACCGCCAGC CAGGCCGAGC TCGTGCTGGC CTCGGACCTC 
GGAAAGAGCG CCACCCTGCG CGCAACTGAG GGCAGGATCC ACCTCGAGCG TCCTGGCGTC 
GACGCTCAGT CGATGCCCTG GCCAGGCGGC CCCGTCCGAG TCGTCGTCGA CGGTCCCGTT 
CTCGAGGTCT CCTGCGCCGG CGGGCTACTC GGAGGACCCA TAGCCCCGGC CACCCGGTGG 
GACGGACCAG CCGAGGCGTG CTCGGCCTGG AGGCTTGCTA TCGACTAG

Protein sequence

MRPLVHFTAD AGWINDPHGL TFHRGRYHLF HQYVPESMVW APNCHWGHAT SSNLLTWTRH 
RVAIAPGDGD DGIWTGSLAL TGQDATILYT SVAQPDLGLG RVRLATPADD SWEIWSKGDI 
VVTPPDELDL IAFRDPFVVR DAAGWRMFIG AATREGDALA LTYTSPDLSS WIYEGIALQR 
STKEKDPVWM GALWECPQVF EVDDHWVMVS SVWDNDVLHY AGYALGDRDS YSAGKLMPTE 
WGQLSFGDSY YAPSYFLDED ELPCLMFWMR GVSDADDGWA SCLSLPYSLT VRDDRLVAEP 
HAALAEARGD ALAAGADARA YDLEWDPTAS QAELVLASDL GKSATLRATE GRIHLERPGV 
DAQSMPWPGG PVRVVVDGPV LEVSCAGGLL GGPIAPATRW DGPAEACSAW RLAID