Gene Noca_2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Noca_2041
Symbol
ID	4595795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardioides sp. JS614
Kingdom	Bacteria
Replicon accession	NC_008699
Strand	-
Start bp	2184532
End bp	2185695
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	72%
IMG OID	639776644
Product	glucose sorbosone dehydrogenase
Protein accession	YP_923237
Protein GI	119716272
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCATGC TCGTTCTCGG ACTGACCGCG ATGCTCGGCC TGACGCTCAC GACCGCCACG 
CCGGCCGACG CCCATGCCCC CGCCACCGAC ACCGCCGCCG CGACGACGCA GGTTCCGGCA 
CTGAGGGTCA CCCGGCTGGT CACCGGCCTC GACCACCCCT GGGACGTCCG GCCGATCGGC 
GACGGCCGGC TGATCTTCAC CCAGCGCGAC CGGGCCACCG TCTCGATCTG GGACGGCAGC 
CGGACCCGGC TGGTGCAGGG CTTCCCGAGC GACTCGGTGT GGGTCTCCGG CGAGACCGGG 
CTGATGGGGC TCGAGGTCGA CCCGTCGTTC GCGAGCAACC GCACGTTCTA CACCTGCCAG 
GGCGGCTTCA CCGCCGGTGG CGGGCACGAC GTGCGCATCA TCCGCTGGAC GCTGCGCGAC 
GACCTGGTCT CGATCTCGGG GAGCAAGCGG CTGCTCGGCG GACTGCCCGC CACCAGCGGA 
CGGCACGGGG GTTGCCGGCT GCTGGCGGTC GGCAAGCGGC TGTACGCCGG CACCGGGGAC 
GCCGCGACCG GCAGCACGCC GGAGAACAAG AAGTCGCTGG GCGGCAAGAC GCTGTGCCTG 
CTCGCCGCGA CCGGCAAGCC CTGCGGGAGC AACCCGTTCG CCGGGTCGAA GAACCACAAC 
AAGCGCTACG TGCACACCTA CGGCCACCGC AACGTCCAGG GCCTCGACCG GCGCCGCGAC 
GGCACCCTGT GGTCGGTCGA GCAGGGCAGC TACCGCGACG ACGAGGTCAA CCGGCTGCGC 
AAGGGCGGCG ACTACGGCTG GAACCCGGTC CCGGGCTACG ACGAGTCGGT GCCGATGACC 
GACCAGTCGC TGCCGGGCCG CCAGCGCGCC GCCGTATGGC GCTCGGGCGA CCCGACGCTG 
GCCACCTCCG GCGGCGGCTT CGTCTACGGC AAGCGATGGG GCGCCCTGGA CGGCAGCTTC 
GCGGTCGCCG CGCTCAAGGC GGAGAGGGTG CTGTTCCTCC AGCTCTCCGC ATCCGGCAGG 
CTGCAGAGGG TGCGGGTGCC GGCGGCGCTG CGTCAGCACG GCCGGATCCG CACGGTGGTC 
GACGGCCCCG GCTCGGTCGC CTACGTCACC ACCGACAACG GGAACGGGAA CGACGCGATC 
CTCGTTGTCA GACCCACACG ATGA

Protein sequence

MRMLVLGLTA MLGLTLTTAT PADAHAPATD TAAATTQVPA LRVTRLVTGL DHPWDVRPIG 
DGRLIFTQRD RATVSIWDGS RTRLVQGFPS DSVWVSGETG LMGLEVDPSF ASNRTFYTCQ 
GGFTAGGGHD VRIIRWTLRD DLVSISGSKR LLGGLPATSG RHGGCRLLAV GKRLYAGTGD 
AATGSTPENK KSLGGKTLCL LAATGKPCGS NPFAGSKNHN KRYVHTYGHR NVQGLDRRRD 
GTLWSVEQGS YRDDEVNRLR KGGDYGWNPV PGYDESVPMT DQSLPGRQRA AVWRSGDPTL 
ATSGGGFVYG KRWGALDGSF AVAALKAERV LFLQLSASGR LQRVRVPAAL RQHGRIRTVV 
DGPGSVAYVT TDNGNGNDAI LVVRPTR