Gene Namu_3749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3749
Symbol
ID	8449368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4114799
End bp	4116016
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	75%
IMG OID	645042800
Product	histidine kinase
Protein accession	YP_003203036
Protein GI	258653880
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.0957761
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0728761
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGCCG CCCCTCCCGC CGCCGGTCCC GAGGGGCCGG CTCGCTCGAC GCGCCGCCGC 
GGCCCGATCG ACCAACGGCA GAGCCTGCGG CTGCGGCTGA CCCTGCTGTC CACCGCGTTG 
CTGGCCCTGT TCGGCGCGCT CCTGCTGGCC CTGTCCTACC TGCTGGTCGG GCGGGTGGTG 
GCGGCGCTGC CGCAGTTCCC GCCGGGGACC CTGGTGCAGG TCGGCGACCA GCTGATGGAC 
GCCTCGACGG CCGCCGCCGA GATCGCCGGG CAGGGGCGGC AGACGGTGCT GGTGGTCGGC 
CTGATCGCGT TCCCGATCCA GGTGCTGGCC GGCGCGCTGC TGTCCTGGCT GCTGATCGGG 
CGGACGCTGC GCCCGCTGTT CACCCTGACC CGCACCGCCC GGGTGCTGTC CGAGTCGTCG 
CTGGACCGGC GGATCCGGCT GTCCGGGCCG CGGGACGAGG TCGCCGACCT GGCCGACACC 
TTCGACGAGA TGCTGGACCG GCTGCAGGCC GCGTTCGACG CCGAGCGCCG GTTCGTCGCC 
AACGCCTCGC ACGAGCTGCG CACCCCGCTG TCGGTGATCC GCACCGAGGT CGAGGTGACC 
CTGGCCGACC CTGAGGCCAG CGCCGCGGAC CTGCGCGAGA TGGGGGCGGT GGTGCTGGAG 
GCCACCGACG GGGCCAACCG GCTGCTCACC TCGTTGCTGG TGCTGGCCCG GACCCAGGCG 
CGGGGGGTCT CGGTGCTGCA GGTGGTCGAC TTCGCCGATC TGATCGCGCC GACCCTGCAG 
GCCAACGAGT CGGCGATCGC CGAACGGGGC CTGTCGGTCT CGGTGCAGGC GGCCCCGGCG 
CCGGTCTCCG GTGACCCGGC GCTGCTCGGC CGGCTGATCG GCAACCTGGT GGAGAACGCG 
GTGCGGCACA ACGTGGCCGG CGGGTGGATC ACCGTGCGGA CCGAGCGCGA CGGCGGCGAG 
TCGGTGCTGG AGGTCGCCTC CTGCGGGCCG GTGATCGACG AGCGCACCGT CGGCGAGCTG 
TTCGAGCCGT TCCGGCAGGG GCGGCGGCCC CGAACCGGGC AGCGGGGGAC CGGCCTGGGC 
CTGTCGATCG TGCGGGCCGT GGTCGCCGCC CACCACGGGT CGGTGGTGGC CGCACCGGTC 
CCGGACGGCG GTTTGCGGGT GACCGTCCGG CTGCCCTTCG ACGACGGCAC GGGCCGTCCC 
GACCGATCGG AGAGGTGA

Protein sequence

MSAAPPAAGP EGPARSTRRR GPIDQRQSLR LRLTLLSTAL LALFGALLLA LSYLLVGRVV 
AALPQFPPGT LVQVGDQLMD ASTAAAEIAG QGRQTVLVVG LIAFPIQVLA GALLSWLLIG 
RTLRPLFTLT RTARVLSESS LDRRIRLSGP RDEVADLADT FDEMLDRLQA AFDAERRFVA 
NASHELRTPL SVIRTEVEVT LADPEASAAD LREMGAVVLE ATDGANRLLT SLLVLARTQA 
RGVSVLQVVD FADLIAPTLQ ANESAIAERG LSVSVQAAPA PVSGDPALLG RLIGNLVENA 
VRHNVAGGWI TVRTERDGGE SVLEVASCGP VIDERTVGEL FEPFRQGRRP RTGQRGTGLG 
LSIVRAVVAA HHGSVVAAPV PDGGLRVTVR LPFDDGTGRP DRSER