Gene Namu_3388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_3388
Symbol
ID	8449003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	3726071
End bp	3727279
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	75%
IMG OID	645042465
Product	histidine kinase
Protein accession	YP_003202705
Protein GI	258653549
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.000377733
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000242442
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGTGGT GGCCGAGGGC AGGCAGCTGG CTGCGCGCCC ACCCCACCCT GCTGGACGGG 
TTGCTGGCGC TGCTGGTCAT GGGGCCGGCC TTCGCCGGCC GGGTGAACGT GCTCCCCGGA 
ACGCCGATCA CCCCGACCGC GGTGTCCCAG GTGCTGGTGG TCGTCGCCTG CCTGGCCCTG 
ACGGTCCGCC GGCGCTGGCC GGTGCCGGTC TGGCTGGTCA CCCTGACGGC GGGTGTCGCG 
GTGATCCTGC TGCAGCAGGG CCCGTCGCCG GCCCTGCTGC CGCTGCTCGT CGCCCTGTAC 
ACGGTGGCGA CCCGCTGGCC GGTGGCGCGG GCGCTGCTGG CGGCCGCGGG GTCGGCCGGA 
CTGCTGCTGC TCGCCCAGGG TTTCGCCACG GCCGACCGCT GGGATCGGCC GACGACCTAC 
GTCGTTGCGA CCTGGTGCGT CCTGTCGGCC GTGGTCGGTA TCTCAGTGCG GCAACAGCGA 
CTGGCCCTGG CCCAGGCGCG CGAGCGGGCC CGGGTGGCCG AGGAGTCCCG TGAGGAGGAG 
GCGCAGCGCC GGGTGACCGA GGAACGGCTG CGGATCGCCC GCGAGCTGCA CGACGTGGTG 
GCCCACCAGA TCGCGGTGAT CAACGTGCAG TCCGGGGTCG CCGAACACCT GCTGCCGGTG 
AATCCCGAGC GGGCCGCGGA GGCCCTGCGG CACGTCCGGG AGGCCAGCTC CCAGGTGCTG 
ACCGAGATGG GCACGCTGCT GGGCGTGCTC CGCGGTGCCG ATTCCGACGA GGCGGATCGG 
GAGCCAGCGC GCGGGCTGGC CGAGCTGGAT CAGCTGGTGG CGTCGCTGCG CCGCACCGGA 
CTGCAGATCG TCTTCCGGCA GGAGGGAACG CCCGTTCCGC TGGGCCCGTT GGTCGACGTC 
ACCGCGTACC GGATCGTCGA GGAGGCACTG ACCAACGCCC ACAAGCACGG GGCCGGCACT 
GCGCGCCTGC TGTTTGCCTT CCGGCCGCCC GGGCTGGTCG TCGAGGTGGA CAACCCGGTC 
GAGCCCGGCC TTTCCCGGGC CGCCGGTTCC GGGCGGGGGC TGGCTGGCAT GTACGAGCGG 
GTCGCCGCCA TCGGCGGCGG CCTCCGGGCC GGGCCGGCCG GCCGCGACCG GTTCACCGTC 
CGCGCGGAGC TGCCCGCCGC GGGCCGGCCG GCCGTCACCG GGCCGGCGGT CGAGGCGGTG 
CCGTCGTGA

Protein sequence

MTWWPRAGSW LRAHPTLLDG LLALLVMGPA FAGRVNVLPG TPITPTAVSQ VLVVVACLAL 
TVRRRWPVPV WLVTLTAGVA VILLQQGPSP ALLPLLVALY TVATRWPVAR ALLAAAGSAG 
LLLLAQGFAT ADRWDRPTTY VVATWCVLSA VVGISVRQQR LALAQARERA RVAEESREEE 
AQRRVTEERL RIARELHDVV AHQIAVINVQ SGVAEHLLPV NPERAAEALR HVREASSQVL 
TEMGTLLGVL RGADSDEADR EPARGLAELD QLVASLRRTG LQIVFRQEGT PVPLGPLVDV 
TAYRIVEEAL TNAHKHGAGT ARLLFAFRPP GLVVEVDNPV EPGLSRAAGS GRGLAGMYER 
VAAIGGGLRA GPAGRDRFTV RAELPAAGRP AVTGPAVEAV PS