Gene Ndas_4365 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_4365
Symbol
ID	9248240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	5199229
End bp	5200635
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	73%
IMG OID
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_003682260
Protein GI	297563286
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.665132
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.714097
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACTGA CCATGACCTC CTCCGGCGGT CCGCGCGGAA CCGTTCCGAC TACGCTCGGA 
AGAATGCGCA CCCCCGGCTC CCCGACCGAC CCGTCCTCCT GGGTCACGCT GCACGAGAAC 
CGTCCGCCCC GCGTTCTGGA ACTGCTGTTC TGGGGCGCGG TGGCACTCAC CCTCGGCCTT 
TACGCGCTGC TGTTCCTGAG CGGCCAGATG CGTTTCCACG GCGGCGACCC GGTCGCCAAC 
ACCGCCGTGC TCGTCAGCGT CGGCGTCCTG CTGCTCTGCT GCGCGCTGTG GCCGTTCCTG 
GCGTGGTCCC CGGTGTCCCC GTGGCCGCGC AGGGCCGTCA GCGCCGTCTT CCTCGCCCTC 
ACCGTGCTCT GCATGCTCAG CAGCAACCAC ACGACCTTCC TGCTGTTGTG CGTGGGCACC 
ATGAACGCGG TGGCCGTGTT CGGGCTTCCG GGCGGCGTCG GCTACGGCTC CGCCGTGCTC 
GTGTTCAGCG TCGGTCTGAC CCTGGTGGTC CCCGACCTGC CGTTCGCGGT GGGGCTGTTC 
GCCGGGGTGA TCCTGCTGTT CATCGTGGCG GCGTCGGGAA CGGTGTTCCT CGGCCTGACC 
GTGGCCGCGC GGCGGGCCGA GCACACACGG GAGCTCCTGG CCGCGCTGGA GGAGGCCCAC 
GGGGAGCTGC GACGCCGCTC CGATCGCATC CGCGAGCTCA CCGTGGCGGA GGAGCGCGCC 
CGCATGTCCC GGGAGATGCA CGACAGCACC GGCCACTACC TGACCGCGCT CACCATGTCG 
CTGTCGAACG CGCTGCGCTT TCGCACCGCA CGGCCCGACT CGGCGTGGGA GGAGGTGCGA 
CAGGCCCGCG AACTCGCCCG GGAGGCGCTC ACCGACACCC GGCGCTGGGT GCGCGCGCTG 
CGCCCCCTGG GGTTGGAGGG GCGCGCGGGG CTGGCCGCGA TGCGGGCGAT GGCGGCCTCC 
TTCGACGGCG GGGGCGTCCG GATCAGGTTC GCCGTCACCG GCGACGGGGT CTGGCCCGAC 
CTGTCGGAGG AGGCCGAGCT GGTCTGCTAC CGGGCGCTCC AGGAGGGCCT GACCAACGCC 
ATGCGCCACT CGGGCGCCGA CCTGATCGAG GTGGAGGTGC TGACCCGCGC CGAGGGGGTC 
GCGGTCACGG TGACCGACAA CGGCGGCGGC GCGGGGAAGG AGGCGGTGCG CGCGGGGTTC 
GGGCTGCGGG GTCTGTCCGA ACGGGTCGCG GCCGTCGGCG GGACGATGCT CAGCGGCAAC 
GTGTGCGCGG CCGACCGGGC GCGGGAGGCC GCGACACCGG GGAGCACGCC CCCGGCGGAT 
ACCCTCGGCT TCCGGCTCCG CGCGGAGGTC CCCGCGCGCG CCGGTACGCG GGAGACTGTT 
CCCGGCACGG CGGGGGGCAC CACATGA

Protein sequence

MPLTMTSSGG PRGTVPTTLG RMRTPGSPTD PSSWVTLHEN RPPRVLELLF WGAVALTLGL 
YALLFLSGQM RFHGGDPVAN TAVLVSVGVL LLCCALWPFL AWSPVSPWPR RAVSAVFLAL 
TVLCMLSSNH TTFLLLCVGT MNAVAVFGLP GGVGYGSAVL VFSVGLTLVV PDLPFAVGLF 
AGVILLFIVA ASGTVFLGLT VAARRAEHTR ELLAALEEAH GELRRRSDRI RELTVAEERA 
RMSREMHDST GHYLTALTMS LSNALRFRTA RPDSAWEEVR QARELAREAL TDTRRWVRAL 
RPLGLEGRAG LAAMRAMAAS FDGGGVRIRF AVTGDGVWPD LSEEAELVCY RALQEGLTNA 
MRHSGADLIE VEVLTRAEGV AVTVTDNGGG AGKEAVRAGF GLRGLSERVA AVGGTMLSGN 
VCAADRAREA ATPGSTPPAD TLGFRLRAEV PARAGTRETV PGTAGGTT