Gene Ndas_2086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_2086
Symbol
ID	9245936
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	2506518
End bp	2507687
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	77%
IMG OID
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_003680018
Protein GI	297561044
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.724108
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGCCGGT ACTGTCGGGC GATGCACCGC ATCACCGGCC GCCACGCGTA CGCCGCCGAC 
CTGGCGGCGG CCCTCGTCCT GACCGCGGTC TACGCCGGAT TCGCGCACCT GTCCCCGGTC 
GACGGGCAAC CCGCCTACGA CGGCCCGGTC TGGCTCCCCT GGGCCGTCGC CGCGGCCGTG 
GGCCTGCCCG TCGCGGTCCG CCGCCGCTGG CCGCTGCCCG TGCTGGGCAC GGTAATGGCC 
GCCCTCACCG CCGCCACCCT CCTGGACCTG ACCCGGGAGC CCTACACCGC GGCGGGTCTG 
GCCGCCTACC TGGTGGGGTT GGCCGAGCCG GCCCGCCGTG CGGTCCCGGC CCTGGTCGCC 
GCGCTGGCGA CGGCCGCCGC CGGAGTGTAC GTCGGGGAGG CGGTCGTCAC CCCGGCGGGG 
GACCGGCAGG ACGCGGTCGG CCTGGCCTCC CTGGTGGTGC TGGTGGTCGG CGGCGCCTGG 
GCGGCGGGCT TCGCCGTGCG CTCCCACCGG GCCCGGGGGC GGCGGCGGGC CGAGCGGGCG 
CTGACCGAGG AACGGCTGCG CATCGCCCGC GACCTGCACG ACGTCGTCTC GCACAACCTC 
GGCCTGATCG CCGTCAGAGC GGGTGTGGCC GCACACGTGG CGGAGGCTGA CCCACGCGAG 
GCCCGGGTCG CGCTCAGGGA CATCGAGGAG GCCAGCAGGT CCGCTCTGAC GGAGATGCGC 
CGCGCCCTGG GGGTGCTGCG CACCGAACAG GCCCCGCTGG CCCCGGCGCC GGGCCTGGAC 
GGTCTCGACG GACTCGCGCG GGACGCCCGC AGGGCCGGGG TCGACGTGCG CCTGACGGTC 
CGCGGCATGC GGGGTGTTCC GGAGGGCACC CGCCTCATGG CGTACCGGAT CGTGCAGGAG 
GCCCTGACCA ACGCGGTCCG GCACGCGGCT CCGACCCGGT GCGAGGTGAC CGTCGCCTCG 
GACGGCGCGG CGGTCGACAT CGAGGTGGTC GACGAGGGGC CCGCGGAGGG CTCCCGTCGC 
CCGCCCGGGG GTCCCACGGG CGGACACGGC CTCCTGGGCA TGCGGGAACG GGCGATGATG 
TGCGGGGGCG CTTTCACCGC GGGACCCCGT CCGCAGGGCG GTTTCGCGGT GGCCGTACGA 
CTGCCGACCG GACAGGAGAG CACGCCGTGA

Protein sequence

MGRYCRAMHR ITGRHAYAAD LAAALVLTAV YAGFAHLSPV DGQPAYDGPV WLPWAVAAAV 
GLPVAVRRRW PLPVLGTVMA ALTAATLLDL TREPYTAAGL AAYLVGLAEP ARRAVPALVA 
ALATAAAGVY VGEAVVTPAG DRQDAVGLAS LVVLVVGGAW AAGFAVRSHR ARGRRRAERA 
LTEERLRIAR DLHDVVSHNL GLIAVRAGVA AHVAEADPRE ARVALRDIEE ASRSALTEMR 
RALGVLRTEQ APLAPAPGLD GLDGLARDAR RAGVDVRLTV RGMRGVPEGT RLMAYRIVQE 
ALTNAVRHAA PTRCEVTVAS DGAAVDIEVV DEGPAEGSRR PPGGPTGGHG LLGMRERAMM 
CGGAFTAGPR PQGGFAVAVR LPTGQESTP