Gene Namu_4222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_4222
Symbol
ID	8449848
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	-
Start bp	4673366
End bp	4674667
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	72%
IMG OID	645043271
Product	histidine kinase
Protein accession	YP_003203500
Protein GI	258654344
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.0052969
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0674921
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAACGCC GGGTTCTGGT GTCGATCCTG CTGGTCATCG CGGCGACCGT TCTGACCCTG 
GGCGTCCCGC TCTCGATCGT CTCCTGGCGA GTCGTCGACG ACCTGATGCG CAGCGACCTG 
AACAGTCGCC TGGATTCGAT CGCCGCCTCG ATCGCCAACC AGTCCAGCTC GTCGGCCATC 
GATCTGGGGC AGTTGGCCGC GGCGGTGCCC TCCGGCGGCC GGCTGGACAT CACCATGGCC 
GGCCGGATCG ACCAGTCCAT CGGGACCACC TCAACCAGCC AGGTCTACTC CGAGCAACTG 
GCGATGGCCG GTGGCGGCAC CCTGCGGTTG TCGGTGCCAG AGAGCTATCT GCGGGCCGAG 
CAGTGGAAGG CGTTGGCGTT GGTCGCGCTG GCCATCGCGC TGTCCGTGGT GGTCGGTACT 
GGGGTCGCGG TGCTGACCGC TCGCCGCCTG GCGACCCCGT TGACCGATGT CGCGCGCCGG 
GCCGCCCGGC TGGGCTCGGG CGACTTCCGG ACCTTCCGGC GCCGGTACGA CATTCCGGAG 
CTGGACCGGG TCGCGGACGT CCTGGACTCC TCGGCGCACG ACATCTCCGC GCTGATCGCC 
CGGGAGCGGG ACCTGGCCGG TGACATCTCG CACCAGCTGC GGACCCGGCT CACCGGGTTG 
CGGTTGCGGC TGGAGGAGCT CGCCGAGTAC CCGGACGCCG ACGTGCAGCA GGAGGTGCAG 
GAGGCCCTGG AACAGACCGA TCGCCTGGTC ACGGTGGTCG ACGACCTGCT GGCCAATGCC 
CGGTCGCAGC GCGCGGCCGG GGCCAGCGAG TTGGAGCTGT TCGACGAGCT GGCCGAGATC 
GAGGCGGAGT GGGGGCCGGC GCTCACCGCG GCGGGCCGCA CGCTGACGGT GCGCTGCGGC 
CGGGACGTGC GGGTGCACGC CACTCCGGGG CGGCTGCGCG AGGCCATCGG GGTGTTGGTG 
GAGAACTCAC TGCGGCACGG CGCGGGCACG GTCGGGGTGC TGGTCCGGCC GGCCGGCCGG 
GGCTCGGGCG GCATGGTGGT GCTGGAAGTC AGCGACGAGG GGCCGGGCAT TCCCGAGGCA 
CTGGTCGCGC ACATCTTCGA TCGGGGGGTG TCGACCGCGT CGTCCACCGG GATCGGGCTG 
GGGCTGGCCC GGGCGTTCGT CGAGGCCGAC GGGGGACGGT TGGAGCTGCG GCGCGCCGTC 
CCGCTGACCT TCGCCATCTT CCTGGTGGTC AGCGAAGAAC CGTCCACGCC GGATGCGGAG 
GGCGACCGGG TGCCGGGGCC GGCCGGCGCC CCCGTCGGGT AG

Protein sequence

MQRRVLVSIL LVIAATVLTL GVPLSIVSWR VVDDLMRSDL NSRLDSIAAS IANQSSSSAI 
DLGQLAAAVP SGGRLDITMA GRIDQSIGTT STSQVYSEQL AMAGGGTLRL SVPESYLRAE 
QWKALALVAL AIALSVVVGT GVAVLTARRL ATPLTDVARR AARLGSGDFR TFRRRYDIPE 
LDRVADVLDS SAHDISALIA RERDLAGDIS HQLRTRLTGL RLRLEELAEY PDADVQQEVQ 
EALEQTDRLV TVVDDLLANA RSQRAAGASE LELFDELAEI EAEWGPALTA AGRTLTVRCG 
RDVRVHATPG RLREAIGVLV ENSLRHGAGT VGVLVRPAGR GSGGMVVLEV SDEGPGIPEA 
LVAHIFDRGV STASSTGIGL GLARAFVEAD GGRLELRRAV PLTFAIFLVV SEEPSTPDAE 
GDRVPGPAGA PVG