Gene Namu_5078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Namu_5078
Symbol
ID	8450709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nakamurella multipartita DSM 44233
Kingdom	Bacteria
Replicon accession	NC_013235
Strand	+
Start bp	5663953
End bp	5665059
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	74%
IMG OID	645044114
Product	histidine kinase
Protein accession	YP_003204338
Protein GI	258655182
COG category	[T] Signal transduction mechanisms
COG ID	[COG4585] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	49
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.9788
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGTGA CCATCGGTCG CCGCGCGCCG GTCCGTCCGG CGGCCCGCCG CCCACCCACC 
TCGCTGTACC GGCGACTGCT GGCGTTCAAC GCGGCGGTGG TGCTGGCCGG TGCGCTGGTG 
CTGATCGTCA CGCCGGTGAC GGTGTCGAAC CCGGTACGAC TGACCGAGGT CACGGTCCTG 
GTCATCGGCG GGGCGTTGAT GGTGGCCATG AACGCGATCC TCGTCCGGGC CACGCTGCGC 
CCGCTGGATC AGCTGTCCGC CCTGATGGAG CGGGTGGATC TGCTGCGCCC GGGGGACCGG 
CTGGCGGTGC CTGCCGACCG GGACATGGCC CGGGTGATCG GCCGGTTCAA CGAGATGCTG 
GATCGGCTGG AGCACGAGCG CGGGGTGAGC AGTGCCCACG CCCTGGCCGC TCAGGAGGGT 
GAGCGGCAGC GGATCGCGCG GGAACTGCAC GACGAGATCG GGCAGAGCCT GACCGCCGTC 
CTGCTCGGCC TCAAGCGCAC CGCGGACCAG GCTCCCGCCC CGCTGCGCGA GGAACTGCAC 
GACGTGCAGG AGACCATCCG GGCCTGCCTG GACGAGGTCC GCACCGTCGC CCGCCGGCTG 
CGACCGGGAG TGCTGGAAGA CCTCGGGCTG CGCAGCGCGA TGGCCGCCCT GGCCAGCGAT 
TTCACCGCGG CCAGCCGCGT GCCGGTGGAC ATGGCGGTGG ACCCTCGGCT GCCCGCGCTG 
GGCGCGGACG CCGAGCTGGT GATCTACCGG ATCGCCCAGG AGGCGCTGAC CAACGTCGCC 
CGGCACGCCG ACGCCGACCG GGTGGACCTG ACCCTGATCG CCCACCCGGA CGGCGTGGAA 
CTGACCATCA TCGACGACGG GCGGGGCTTC GACCCGGCCA CCGAGGGCGC CGGCATCCGG 
GGCATGCGGG AGCGGGCGAT CCTGGTCGCG GCGACCCTGA CCATCGGCCC GGACCCCGGC 
GGGGGCAGCC GGCTGCGGCT GTTCCTCCCC CGCCCGGAAA CGGCCGACAG CGAGGCCGCC 
GCGGGCCCCG GTGTCGATCG GGGTGTCGAT CGGGGTGTCG ATCGGGGTGT CGGGCACCGG 
GTCGGGTCGA CCGGGACGCG CCGATGA

Protein sequence

MSVTIGRRAP VRPAARRPPT SLYRRLLAFN AAVVLAGALV LIVTPVTVSN PVRLTEVTVL 
VIGGALMVAM NAILVRATLR PLDQLSALME RVDLLRPGDR LAVPADRDMA RVIGRFNEML 
DRLEHERGVS SAHALAAQEG ERQRIARELH DEIGQSLTAV LLGLKRTADQ APAPLREELH 
DVQETIRACL DEVRTVARRL RPGVLEDLGL RSAMAALASD FTAASRVPVD MAVDPRLPAL 
GADAELVIYR IAQEALTNVA RHADADRVDL TLIAHPDGVE LTIIDDGRGF DPATEGAGIR 
GMRERAILVA ATLTIGPDPG GGSRLRLFLP RPETADSEAA AGPGVDRGVD RGVDRGVGHR 
VGSTGTRR