Gene Ndas_3125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_3125
Symbol
ID	9246981
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	3740918
End bp	3741973
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	77%
IMG OID
Product	putative signal transduction histidine kinase
Protein accession	YP_003681040
Protein GI	297562066
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGTGT GGACGGCGTT CACCACCCGC GCCTACGCCC GCCCGCACCT GCGCGACTGG 
CGCGTGCTCA CCGCCGACCT CGCGGTGGCC TTCGCGTGCC TGTTCGCCAC CGCCCTGGCG 
GCCACGCCGT TCTACCTCAC CCAGGCCCCG CCGCTGAGCG GCTACTGGTT CGCGGGCACC 
GCGCTGGCGG CCAGCGTCAT CTGGGGCGGG CGCGCCGCCG CGGCCGTCGC CGTGCTCTAC 
GGTCTCGCCG ACCTCACCCT GCGCACGGTC ATGGACGCCG CCGTGACCGC CGCGACCGCC 
CGCGGCGTGG TCCTGCTGCT CCTGGCCGGC CTGGCGGTCG GATACATGTC CTGGATGTCG 
GAGCGGGCCG AACGGCGGTT CGCGCAGGCG GTCGCGCTGG AGGCGCGCAC CCGCGAGCGC 
GAGCAGCTGG CCCGCTCGAT CCACGACTCG GTGCTCCAGG TGCTGTCCCT GGTGAGCAGG 
CGCGGCGCCG AGGCCGGGGG AGAGGCCGCC GAACTGGGCC GGATGGCCGG TGAGCAGGAG 
GCGCGCCTGC GCGCGCTGGT CGCGATCGGA TCGTCGGAGG ACGCCTCCGG CGGGACGGAC 
GGGATGAACG GGACCGGCGG GGCGGCGCCG CCTCCCGCGG GGCGCACTGC CGCGGCAGGA 
ACCGGGGACG CGGTGGACCT GCGCGAGCCG CTGCGCCGCG CCGAGTCGGC CCGCGTGTCG 
GTGTCCGCGC CCGCCACGCC CGTCGTCCTG CCCGCGCACA CCGCCGCCGA ACTCGCCGCC 
GCCGTGCTCG CCGCCCTGGA CAACGTGGAG CGGCACTGCC CCGAGGGCAC GCGCGCCTGG 
GTGCTGGTGG AGGACGAGGA CGACGCGGTG ACCGTGTCCG TGCGCGACGA GGGCCCCGGC 
ATCGAGCCCG GCCGCCTGGA GCGGGCCCGC TCCGAGGGCC GCATCGGCGT GGCCCAGTCC 
GTGCGGGGCC GTGTGCGCGA CCTGGGCGGC ACCGTCGAGT ACGTGTCGGT CCCCGGCCAG 
GGCACCGAGG TGGAGATGCG GGTCCCGCGC CGCTGA

Protein sequence

MVVWTAFTTR AYARPHLRDW RVLTADLAVA FACLFATALA ATPFYLTQAP PLSGYWFAGT 
ALAASVIWGG RAAAAVAVLY GLADLTLRTV MDAAVTAATA RGVVLLLLAG LAVGYMSWMS 
ERAERRFAQA VALEARTRER EQLARSIHDS VLQVLSLVSR RGAEAGGEAA ELGRMAGEQE 
ARLRALVAIG SSEDASGGTD GMNGTGGAAP PPAGRTAAAG TGDAVDLREP LRRAESARVS 
VSAPATPVVL PAHTAAELAA AVLAALDNVE RHCPEGTRAW VLVEDEDDAV TVSVRDEGPG 
IEPGRLERAR SEGRIGVAQS VRGRVRDLGG TVEYVSVPGQ GTEVEMRVPR R