Gene Noca_4631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_4631
Symbol
ID	4596087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	4911500
End bp	4912660
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	74%
IMG OID	639779240
Product	glycoside hydrolase 15-related
Protein accession	YP_925813
Protein GI	119718848
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3387] Glucoamylase and related glycosyl hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCTCCC TGCACCCCGA CCCGACCACG CTCGACCTGA GTACCGAGGA GCGCCGCCGA 
TTCGCCGACC TCGCGACGGC GAGCCACCGG ATCATCACCG GCCACCAGGA CCCCGGTGGC 
GCCTACCCCG CCAGCCCGGG CTTCTCGGCG TACGCCGGCT ACGCCTGGCT GCGCGACGGC 
GCGTTCACTG CCGAGGGCAT CTCCCGGTAC GGCGACGCCG ACTCGGCCGG CCGGTTCCAC 
GACTGGGCCG CGCGCACCCT GGCGCGGCGG CGCGAGCAGG TGGACGGCCT CCTGGCGATC 
CTGGCTGAGG GCCGGAGCCC GGCGCGCGTG GCGATGCTGC CCACGCGGTT CACGTTCGCC 
GGCGAAGACG GAACCGACGA CTGGTGGGAC TTCCAGACCG ACGGCTACGG CACCTGGCTG 
TGGGCGGTGG TCGCGTTCGC CCGCCGGCAC GGCCAGGGCC TGGACCGGTG GCGCAGCGGC 
GTCGAGGTCG CCGTCGACTA CCTGACCGGC TTCTGGTCCT CACCGTGTTA CGACTGGTGG 
GAGGAGCACG CCGAGCACCG GCATGTCTCG ACCCTCGCCG CCATCCACGG CGGCCTCCGG 
TCGGTTCTCG GGGCCGATGC GTTGGACCCT GCGCGGGCCG ACGCCGCGGC GTCCGCGATC 
GCCGAGATCC GCGAGCTGGT CCGCCGGCGG GGTGTTGCGG ACGGCCATCT CACCAAGTGG 
CTGGGAACCG ACGCGGTCGA TGCCTCGCTG GCGTCCGCGG TCGTGCCGTT CGGTCTGGTC 
TCCGACCACG ACCCGCTCGC GGCCGGAACG CTTCGGGCGG TCGCTGAACA GCTCGACAAC 
GGTGGCGGGG TCCACCGGTT CCGCGACGAC GTCTTCTACG GCGGTGGCCA GTGGCTGCTC 
CTCTCGGCCC TGCTCGGCTG GAACCTCGCC GAGCGCGGCG AGACCGATGC CGCGCTCCGC 
TACCTGCGCT GGGTCGCCGG CCAGGCAACC GCGGCCGGCG AGCTCCCCGA GCAGGTGTCC 
GGCCACCTCC TGCACCCCGG GCACCGTCAG GAGTGGATCG ACCGCTGGGG GCCGGTAGCG 
ACCCCGCTGC TGTGGTCGCA CGGCATGTAC CTGATCCTCG CCGACACCCT CGGCCTGCTG 
CGCGAGGAGG GCGACCGGTG A

Protein sequence

MSSLHPDPTT LDLSTEERRR FADLATASHR IITGHQDPGG AYPASPGFSA YAGYAWLRDG 
AFTAEGISRY GDADSAGRFH DWAARTLARR REQVDGLLAI LAEGRSPARV AMLPTRFTFA 
GEDGTDDWWD FQTDGYGTWL WAVVAFARRH GQGLDRWRSG VEVAVDYLTG FWSSPCYDWW 
EEHAEHRHVS TLAAIHGGLR SVLGADALDP ARADAAASAI AEIRELVRRR GVADGHLTKW 
LGTDAVDASL ASAVVPFGLV SDHDPLAAGT LRAVAEQLDN GGGVHRFRDD VFYGGGQWLL 
LSALLGWNLA ERGETDAALR YLRWVAGQAT AAGELPEQVS GHLLHPGHRQ EWIDRWGPVA 
TPLLWSHGMY LILADTLGLL REEGDR