Gene Ndas_3847 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3847
Symbol
ID	9247718
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	+
Start bp	4615200
End bp	4616486
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	73%
IMG OID
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_003681750
Protein GI	297562776
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCAGGC GGATGGTTTT CTCCACCCTG GTGGTGACCG TCATCGCCGT CATGCTGCTC 
GGGCTGCCCC TGGGCGCGCT CACGTACAAG CTGGTGTACG ACGAGAGCAC CCGCCAGCTC 
CAGGGCGAGG CGGAGCTGAT CGGCGCCGAG AGCGACACCA TGCTGGAGCT GCACGGCCAA 
CTCGACCTGG GCGAGTTCGA CCGCGACCAT CCCCACCGCT TCATCCGGAT CACCCCGGCG 
GAGGAGCCCA CCTCGGTGAC CGCGGGCGAT CCCGCGCTCG ATCCCGAGGC GCCCGACTCC 
CCGAGCATGC TCAAGGCGAC CGCGACCACC GGCCGGGGCA CGCGCGTCGA GGTGTGGATG 
AGCGCCGAGA GCGTGCAGCA GAGCGTGGTC CGCGCCTGGA TGGGGATCGC GTCGCTGTCC 
CTGCTGGCCA TCGGCGTCGC CGTGGGCCTG TCGATGTTCC AGGCCCGCAG GCTGACCCTG 
CCCCTGCTCG ACCTGGCGGC CACCGCGGAG CGCCTGGGCT CGGGCGTGAC CACGCCGTGG 
GGCCACCGGT ACGGGATACC GGAGGCCGAC CGGGTGGCGG AGGTCCTGGA CCGCAGCGCC 
GAGCGCATCG CCGGGCTGAT CGCCACCGAG CGCCACTTCG CGACCGACGC CTCGCACCAG 
CTGCGCACGC CGCTGACCGC GCTGACGATG CGCCTGGAGG AGATCCTGGC CGAGGCGGAC 
AACCCCGAGG TGGTCCGCGA GGAGGGCGAG GCCGCCCTGG CCCAGACCGA GCGCCTGGTG 
GAGACCGTGG AGAGCCTGCT GGGACGGGCC CGCAAGAGCC AGAACCCCGA GGTGGAGGCG 
GTGGAGATCG ACCCCGTCCT GCACCACCTC CAAGAGGAGT GGCAGCCGGT CTTCCAGTCC 
GCGCAGCGCA GGCTGCTGGT CACCGGCGAC CCGGGGCTGA CCGCGATGAC CGTCTCCGCC 
GACCTGGCGC AGATCGTCGC GACCCTGGTG GAGAACGCCT ACAAGCACGG CGCGGGGACG 
GTCACCATCC GGCGGCTGGA CACCGGGCAG TCGGTGCGCA TCGAGGTGAG CGACGAGGGC 
GAGGGCGTGC CCGAGCACCT GTCGGGCCGG ATCTTCGAGC GCGAGGTGAG CGGCGGGGGC 
GGGACCGGGC TGGGCCTGGC CCTGGCACGG CACATCGCCG AGTCCGAGGG GGCCCGGATC 
GAGCTGGTGC AGACCAAGCC GACGACCTTC GCGCTGTTCC TGCCCGCGGG CGCGGGGGGC 
CTGTCCAAGA TGACGGGCCC GGTGTAG

Protein sequence

MRRRMVFSTL VVTVIAVMLL GLPLGALTYK LVYDESTRQL QGEAELIGAE SDTMLELHGQ 
LDLGEFDRDH PHRFIRITPA EEPTSVTAGD PALDPEAPDS PSMLKATATT GRGTRVEVWM 
SAESVQQSVV RAWMGIASLS LLAIGVAVGL SMFQARRLTL PLLDLAATAE RLGSGVTTPW 
GHRYGIPEAD RVAEVLDRSA ERIAGLIATE RHFATDASHQ LRTPLTALTM RLEEILAEAD 
NPEVVREEGE AALAQTERLV ETVESLLGRA RKSQNPEVEA VEIDPVLHHL QEEWQPVFQS 
AQRRLLVTGD PGLTAMTVSA DLAQIVATLV ENAYKHGAGT VTIRRLDTGQ SVRIEVSDEG 
EGVPEHLSGR IFEREVSGGG GTGLGLALAR HIAESEGARI ELVQTKPTTF ALFLPAGAGG 
LSKMTGPV