Gene Ndas_1961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ndas_1961
Symbol
ID	9245811
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nocardiopsis dassonvillei subsp. dassonvillei DSM 43111
Kingdom	Bacteria
Replicon accession	NC_014210
Strand	-
Start bp	2386026
End bp	2387360
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	69%
IMG OID
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_003679894
Protein GI	297560920
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.000000367534
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.000000631341
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCCACCG CACCCCACCA CCGCGCAGGC CGCCTCACCA CCCTGGCCTA CCTCTTCCTC 
CTGCTCTCCC AGAACATCGC CGCCCTCCTC CTGCTCCCCC TCGTCCTGCT CTCGGCCGTA 
CTCACCCTCA CCTGGGTCGG CCTCCCCTTC GTCATCCTCA CCGCCCTCCT CCTGCGCACC 
CTCGCTGACA GCCAACGCCG CACCCTCAGC CACCTACTCA TCAAAAACAG CAAACCCCCC 
CGAAGCCGCA CCGCCACCCC AGGCCTACCC ACCCCCACCA CCCGCCCCCT ACACCGCCCC 
ATCGTCTCCG CCTACCGCCC CATCCCCCCC ACCGGCATCA CCCGCCGCGG CACCGCCATC 
ATCACCGACC CCGCCACCTG GAGAGACCTG CTCTGGCTCA TCTCCGGAGC CGCCAGCTTC 
CTCCTCGTCG CCACCCCCCT CACCCTCATC GCCCACGGCA TCGAACAACT CCTCTTCGCC 
CTCAACCTCA CCGGCCCCAC CCTCTACGAC ACCTACACCC CCACCACCAC CCTCAACCAA 
CTCATCATCC TCATCCCCGC CCTGGCCCTC ATCACCCTGG GCTGGCTCCT CATCCCCCTG 
GCCGCCGACA CCTACCTACG CTTCAACCGC CTCCTGCTCT CCCCCTCCGA AAAAGCCCGA 
CTCACCGCCC GCGTCGCCCA CCTGGCCACC AGCCGCGCCC ACACCATCGA CACCCAGGCA 
TCCGAGATCC GCCGCATCGA ACGCGACCTC CACGACGGCG CCCAAGCCCG CCTCGTCGCC 
CTGGGCATGA ACCTGGGCAT GGCCGAACAA ATCGTCGACA AAGACCCCGA AACCGCCCGC 
GCCATGCTCA CCGAAGCCCG CGAAACCACC CGCCACGCCC TCACCGAACT CCGCGACCTC 
GTCCGCGGCA TCCACCCACC CGTCCTCGTC GAACGCGGCC TCGACGGCGC CGTCCACGCC 
CTCGCCCTCA CCCACCACCT GCCCATCACC GTCACCATCG ACCTCCGCGG CCGCCCCGCC 
GACCCCGTGG AGTCCGCCGC CTACTTCGCC ATCGCCGAAC TCCTCACCAA CACCGCCAAA 
CACGCCCACG CCACCCACGC CTGGATCCAC ATCAACCACG GCCGCAACCG CCTGGTCATC 
ACCGTCACCG ACAACGGCAC CGGCGGCGCG GACCCCGCCC CCGGCAGCGG CCTGGCCGGC 
ATCCGCAGAC GCCTGGACGC CTTTGATGGC ACGATGAACA TCACCAGCCC ACCGGGCGGC 
CCCACCATCG TGACCCTGGA GATCCCGTGC GTGTTGTCAT CGCCGAAGAC CTTGCCCTCC 
TCAGAGACGG CCTGA

Protein sequence

MATAPHHRAG RLTTLAYLFL LLSQNIAALL LLPLVLLSAV LTLTWVGLPF VILTALLLRT 
LADSQRRTLS HLLIKNSKPP RSRTATPGLP TPTTRPLHRP IVSAYRPIPP TGITRRGTAI 
ITDPATWRDL LWLISGAASF LLVATPLTLI AHGIEQLLFA LNLTGPTLYD TYTPTTTLNQ 
LIILIPALAL ITLGWLLIPL AADTYLRFNR LLLSPSEKAR LTARVAHLAT SRAHTIDTQA 
SEIRRIERDL HDGAQARLVA LGMNLGMAEQ IVDKDPETAR AMLTEARETT RHALTELRDL 
VRGIHPPVLV ERGLDGAVHA LALTHHLPIT VTIDLRGRPA DPVESAAYFA IAELLTNTAK 
HAHATHAWIH INHGRNRLVI TVTDNGTGGA DPAPGSGLAG IRRRLDAFDG TMNITSPPGG 
PTIVTLEIPC VLSSPKTLPS SETA