Gene Namu_1848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_1848
Symbol
ID	8447453
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	2032703
End bp	2033725
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	76%
IMG OID	645040977
Product	Inositol 2-dehydrogenase
Protein accession	YP_003201227
Protein GI	258652071
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.0363596
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.186986
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGGA GCGGACCGGT GCGGGTCGGC CTGATCGGCG CGGGCTGGAT GGGCCGGTTC 
CACGGGCAGA CCCTGGCCCG GCGGATCCCC GAGGCCGAGT TGGTCGCGGT GGCCGACCCG 
GCGCCGGGGG CGGCCCGGCA GGCGGCCGAC GAGCTCGGCG CCCGGCAGGC CTACCAGGAT 
CCGGCCGACC TGATCGGCGA CCCGGCCGTG GCGGCGGTCG TCATCGCCTC GCCGGCCCAC 
TTCCACACCG ACCTGGTGGT GGCCGCCGCG GCCGCCGGCC AGGCGATCTT CGTGGAAAAG 
CCGATGGCGT TGACCGTCGC CGACGCCGAC CGGGCGATCG CCGCCGCGGC CGCCGCCGGC 
GTGCCCCTGC AGGTCGGGTT CAACCGGCGG TTCGCCGCCG GCTTCGCCGC CGCCCGGCGC 
GTCATCGACG ACGGGGGAAT CGGCACCCCG CAGCTGCTGC GCTCGCTGAC CCGCGACCCG 
GGCGGGTTCG ACCCGGCCGC GGTCAAGCCG GGCGCGATCT TCCTGGAGAC CCTGATCCAC 
GACTTCGACA CGCTGCGCTG GTTCAACCCC GGGGCGCGGG TGCTGGACGT CTACGCCGTC 
GCCGATGCCC TGGTCCATCC CGAGTTCGCC GACCGCGGGC TGCTGGACAC CGCCGTGGTC 
ACCCTGCGGT TCGACAACGG GGCGATCGCG GTGGCCGAGG CCAACTTCTC CGCCGCGTAC 
GGGTACGACG TGCGCGGCGA GGTGTTCGGC TCGGCCGGCC TGGTGACCGC CGGTGACGTG 
CACGCCACCG AGATGCGGCA CCTGCACGCC GGGGGATCCA GCGGATCGAC CGTCCGGCGC 
AACATCGACC TGTTCCGCGA CGCCTACACC CAGGAACTGG CGGACTTCGT CGCCAACCTC 
CGGGGCGCGA ACCGGCCGGT ACCGACCGGG CCGGACGCCC GGGCCGCGCT GGCGATCGCG 
CTGGCCGCCA TCGACTCCGT CGCCGCCGGC GCCCGGGTCG CGCTGCCCCC GGACGCGGCG 
TGA

Protein sequence

MTRSGPVRVG LIGAGWMGRF HGQTLARRIP EAELVAVADP APGAARQAAD ELGARQAYQD 
PADLIGDPAV AAVVIASPAH FHTDLVVAAA AAGQAIFVEK PMALTVADAD RAIAAAAAAG 
VPLQVGFNRR FAAGFAAARR VIDDGGIGTP QLLRSLTRDP GGFDPAAVKP GAIFLETLIH 
DFDTLRWFNP GARVLDVYAV ADALVHPEFA DRGLLDTAVV TLRFDNGAIA VAEANFSAAY 
GYDVRGEVFG SAGLVTAGDV HATEMRHLHA GGSSGSTVRR NIDLFRDAYT QELADFVANL 
RGANRPVPTG PDARAALAIA LAAIDSVAAG ARVALPPDAA