Gene Namu_3230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3230
Symbol
ID	8448844
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3559148
End bp	3560092
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	74%
IMG OID	645042309
Product	ROK family protein
Protein accession	YP_003202550
Protein GI	258653394
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID	[TIGR00744] ROK family protein (putative glucokinase)

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.00029412
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000117185
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAGCAAGA CCATCGGCAT CGACATCGGC GGTACCTCGG TGCGCGCGGC CGTCATCGAC 
GGCATCTCCA TCGGCCCGTC CCTGCGTGAG GCCACCCCGC ACACCGAACG GGAGACCGAG 
GACCTGCTGG TCACGCTGAT CACCAAGTTG GCGGCCAGCC AGCCGGTGTC CGCGGTCGGG 
CTGGCCGTGG CCGGGTTCGT CAGCGCCGAC CGGCAGCGGG TCATGTTCGC CCCGCACCTG 
GCCTGGCGGG ACGCTCCGGT GCCCGAGCGG GTGTCCGCCC GGGTGGGCCT GCCGGTAGTG 
ATGGACCACG ACGTGAACTC CGCGGCCTGG GCCGAGTACC GCCTGGGCGT GTCCGCGGGA 
TCCTCCATCG CCCTGCTGGT CGCCCTGGGC ACGGGGATCG GTGCCGGGCT GCTCGTCGAC 
GGCCAGATCT ACCGCGGGGC GCACGGCGTG GCGCCCGAGC TCGGTCACCT GACCGTCGTC 
CCCGGCGGCC GGCCCTGCCC GTGCGGCAAG CAAGGGTGCT GGGAGCGTTA CTGCTCGGGC 
ACCGCGTTGG CCCAGACTGC CCGGCTGCAG ATGGCCGACC ATGACGCGCC GGTGCTGCGC 
CGACTGTCCG GGGACGACCC GGCCGCCGTC ACCGGGACCA TGGTCGCGGT GGCCGCCACC 
GAGGGCGACC CGGTCGCCCT GGGCGCGATG GACGAGCTCG GCCATTGGCT GGCCGCCGGC 
CTGGCGCTGG TCACCGACGT GCTCGACCCG GAGATGATCG TGATCGGCGG TGGGGTGTCG 
GCCGCGGCCG GCATGTTCCT GCCGCTGGCC GTGTCCGAGT TCGGCCGGTC CATCACCGGC 
GCCGGCCACC GGCCGTTGCC ACGGGTCGAA CTGGCCCGGT TCGGCGACCG GGCCGGCATC 
ATTGGGGCCG CGCTGCTGGC GGCCGAGGCC GCCGGCACCG CCTGA

Protein sequence

MSKTIGIDIG GTSVRAAVID GISIGPSLRE ATPHTERETE DLLVTLITKL AASQPVSAVG 
LAVAGFVSAD RQRVMFAPHL AWRDAPVPER VSARVGLPVV MDHDVNSAAW AEYRLGVSAG 
SSIALLVALG TGIGAGLLVD GQIYRGAHGV APELGHLTVV PGGRPCPCGK QGCWERYCSG 
TALAQTARLQ MADHDAPVLR RLSGDDPAAV TGTMVAVAAT EGDPVALGAM DELGHWLAAG 
LALVTDVLDP EMIVIGGGVS AAAGMFLPLA VSEFGRSITG AGHRPLPRVE LARFGDRAGI 
IGAALLAAEA AGTA