Gene Namu_4646 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4646
Symbol
ID	8450275
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5169891
End bp	5171108
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	73%
IMG OID	645043686
Product	glucose sorbosone dehydrogenase
Protein accession	YP_003203912
Protein GI	258654756
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGCTGG TCGCCGGCCT CGCCGTCATC GGCGCGCTGG CCGCCTGTTC AGGGGCCGGC 
GCACCCCTAC CGGCCAGCAC CACCATCGGG CTGAGCGCGC CCGCTTCGGC GGCCACCTCG 
CCGACCGATC CGCCGACTGA CCCGTCGGCC GTGCCGTCCA CGGTGTTGTC CACCGTGCCC 
TCCCCCGCCG GCACCGTGCA GGTGAGCACC GTGGCCACCG GCCTGGCCTC ACCGTGGGGC 
CTGGATTTCC TGCCCGACGG GCGAGCCGTG GTCACCAGCC GCGACACCGC CACGATCAGC 
CTGGTCGACC CCGACGGCAC CATCACGCCG GTGGGCACCG TCGACGGGGT GGTGCCCGGT 
GGCGAGGGCG GGTTGCTCGG GATCGCCGTC TCCCCGGCGT TCAGCACCGA CCACCGGCTG 
TACGTCTACT ACACCGCCGC ACAGGACAAC CGGATCGCCA CCGTCGAACT CGTCGACGGG 
GCAATCGGCA ATCAGCAGGT CGGCTTCACC GGCATTCCCA AGGCCGGCAT CCACAACGGC 
GGCCGGATCG TCTTCGGCCC GGACGGGCTG CTCTACGTCG GCACCGGGGA CGCCGGGGAC 
CGGCCCCAGG CCCAGGACCC GGACGCGCTC GGCGGCAAAA TCCTGCGCCT GGACTCCCAG 
CTCCGGCCGG CCGCCGGCAA CCCGGACGAT CCGGTCCTGG CCGGCGGCGC CGGCTACAGC 
CTGGGCCATC GCAACGTGCA GGGCCTGGCC TTCGACGACC GGGGCCGGCT CTGGGCCGCC 
GAGTTCGGCC AGAACACCTG GGACGAGTTG AACCTGGTCC AAGCCGGCGA CAACGACGGC 
TGGCCGGTCG TCGAAGGAAT CGGCGACAAC CCCGACGGCG TCAATCCCGA ATTCGTCAAC 
CCGCAGCGGC AGTGGTCGAC CGCGGACGCC TCCCCCAGCG GCATCGCCTT CTGGCAGGGC 
TCCATCTGGA TGGCCGGCCT GCGCGGGCAG CAGCTGTGGC AGATCCCGCT GACCGAGTCC 
GGGGCGGAAT CGACCGGGGA GTCGAACGGG GAGCTGACCG GGGAGCCGGT CGGCCATCTC 
AACGGCGTCT ACGGCCGGCT GCGGACCGTG GTCGCCGCGC CCGACGGCAG CCTGTGGCTG 
ATCACCTCGA ACACCGACGG TCGCGGCGAC GTCCGGGACG GCGACGACCG CATCCTGCGC 
CTGCAGCCGG CCGCCTGA

Protein sequence

MGLVAGLAVI GALAACSGAG APLPASTTIG LSAPASAATS PTDPPTDPSA VPSTVLSTVP 
SPAGTVQVST VATGLASPWG LDFLPDGRAV VTSRDTATIS LVDPDGTITP VGTVDGVVPG 
GEGGLLGIAV SPAFSTDHRL YVYYTAAQDN RIATVELVDG AIGNQQVGFT GIPKAGIHNG 
GRIVFGPDGL LYVGTGDAGD RPQAQDPDAL GGKILRLDSQ LRPAAGNPDD PVLAGGAGYS 
LGHRNVQGLA FDDRGRLWAA EFGQNTWDEL NLVQAGDNDG WPVVEGIGDN PDGVNPEFVN 
PQRQWSTADA SPSGIAFWQG SIWMAGLRGQ QLWQIPLTES GAESTGESNG ELTGEPVGHL 
NGVYGRLRTV VAAPDGSLWL ITSNTDGRGD VRDGDDRILR LQPAA