Gene Daro_1667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1667
Symbol
ID	3568852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1791962
End bp	1793920
Gene Length	1959 bp
Protein Length	652 aa
Translation table	11
GC content	50%
IMG OID	637680134
Product	sensor histidine kinase
Protein accession	YP_284884
Protein GI	71907297
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	0.976342
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGAAA ATGCTGTCGA GCGGAAGACT GATTGGGTGC CAACTTTCCG GGAAATCCTC 
CCAGTTTTTT TGCGAAATTT TCTCCACGTT GTTTTGCTTC TACTGCTGGC AACAGGAGTC 
ATTGGCCATC TTGAAATTGA CCGTGAGAAA GTAGGACTCC AGAAACTTGA ATCCCTTCAT 
GTCGGGCTAG CGAGTGGGGT TCTGGATAGT CAGATGGTGC GCCCCCTCCG ACATTTGAGG 
AGCATTGCCC TAGATGAATT GGCCGTGCAA CAGGCGCTAA ATCAGGAGGG AAAGAGGGAT 
AGCCTAGAAA CGCTGCAAGA GCATTTCTGG TCCATTCTGG CCCGCAACCC TGAATACGCT 
CAGATTCGAT GGATTGACAC CGATGGCAAG GAGCGATTAC GTCTTAACCA AGCTGATGGC 
TCCAATATTT GGGTCACACC GGAAGAGCAC CTCCAGGATA AAAGCTCTCG CTACTACGTC 
CAAGCAGCTC TCAAGCTAGC GAAGGGTGAG GTTTATATCA CCCCTCTTGA CCTGAATATT 
GAAGGGGGGC GGCTCGTCGT GCCCTACGAG CCAATGATTC GCCTGGCCAC TCCAATATTT 
CGGAAGGATG GCAAGCTACT TGGGATGTTC GTGTTGAATG TGAACGCTCA ATCAATGTTG 
AGCCAGTTTG TCCAGAGTGC AGCTGGGGGA AACGTTGTTT TGCTTAATCA AGAAGGTTAT 
TGGTTGAAAA GCCCGCACCC CGAGGAGGAG TGGGGGTTTA TGCTTGGCAA TAATGAGACG 
TTTGGCCAAA AATTTCCGCA TGAATGGCAA CTCATCTCAT CCTCCGACGA GGGAGAGACT 
GAAACGTCAA ATGGCGTCTG GACCTGGAAA ACCGTGCGTG TTGTCGGTGA AGTTAAGGGA 
AACATTAACC CCGTGACGTG GAAAACGGTG TCCAACATCT CATCAGAAAC CCTGACGGAG 
TTGCGTCTAA AAGTATGGCT GTTGATGGGA AGTGTAACGG CCATCCTATT GGCAGTATTT 
GCTTGGGCCA AATGGAATAT GGCTAAGCAA AGCCTGCTCC GACAGGTGGC CAATAGGCAA 
ATTCAGACCC AAAACGAACA GCTCGCCAAA GAAGTCGATG AGCATGTCGC TACCCGACAA 
AAATTAGTCG AGACGCTCGA CGACTTGGAA CAACATAAAA ACAATCTTGA GAAGCTGGTG 
GACGTTCGAA CACGGGAACT ACTTAAGGCC AAGGAGGCCG CCGAAGTGGC CAACGTGGCC 
AAGATGCAGT TTCTAGCCAA CATGTCCCAT GAACTACGCA CCCCCCTGCA TCAAATTGCG 
TCCCTGGCTG GGTTATTGAA ACGCACCTTA CCTAATGATG CACACTCGAA ATACTTGGCC 
ATGCAAGAAA AGGCAGTGGC AAGAATGACC AGTGTTGTCG ATTTAATTCT TAATCTGTCT 
GCGATAGAGG CAGGCAAACT ATCGGTCACC GAGATTCCTG TTGATATAGC AACATTGCTC 
CAGGAAGTAT CTGAAGAGTT TCAGGAAGAA ATCACCGCCA AGGGGCTAGA CATGGAGGTG 
ATACCGCTCG CCTCTCCTCT ACACTGCGTT GGTGCCCCCC AACACATAAA GTTGGCACTT 
GAGTGCTATG TAGAAAACGC TGTCCGTTTC ACGGCATCAG GAGGCATTAA GATAAATGTC 
GAATTGATTG AAGCCGAAAA GACAAGCGCA TTGATTCGAT TTGTTGTTGA GGACACGGGC 
ATTGGTATTG CACCAGAAGT CCTGCCCAAG GTATTCAACA GCTTTGAGCA GGCGGACAAT 
TCCTCAACCA GAAAATATGG AGGGACGGGG ATTGGTTTAG CCGTCGCCAA GAAATTGGCT 
GAACTGATGG GCGGAGAGGC AGGATGCACG AGTTCCCTTG GGGCCGGAAG CAAGTTTTGG 
TTCACCGTGC GACTGAAGGT GCTCGCAGGT TCCTGCTAG

Protein sequence

MPENAVERKT DWVPTFREIL PVFLRNFLHV VLLLLLATGV IGHLEIDREK VGLQKLESLH 
VGLASGVLDS QMVRPLRHLR SIALDELAVQ QALNQEGKRD SLETLQEHFW SILARNPEYA 
QIRWIDTDGK ERLRLNQADG SNIWVTPEEH LQDKSSRYYV QAALKLAKGE VYITPLDLNI 
EGGRLVVPYE PMIRLATPIF RKDGKLLGMF VLNVNAQSML SQFVQSAAGG NVVLLNQEGY 
WLKSPHPEEE WGFMLGNNET FGQKFPHEWQ LISSSDEGET ETSNGVWTWK TVRVVGEVKG 
NINPVTWKTV SNISSETLTE LRLKVWLLMG SVTAILLAVF AWAKWNMAKQ SLLRQVANRQ 
IQTQNEQLAK EVDEHVATRQ KLVETLDDLE QHKNNLEKLV DVRTRELLKA KEAAEVANVA 
KMQFLANMSH ELRTPLHQIA SLAGLLKRTL PNDAHSKYLA MQEKAVARMT SVVDLILNLS 
AIEAGKLSVT EIPVDIATLL QEVSEEFQEE ITAKGLDMEV IPLASPLHCV GAPQHIKLAL 
ECYVENAVRF TASGGIKINV ELIEAEKTSA LIRFVVEDTG IGIAPEVLPK VFNSFEQADN 
SSTRKYGGTG IGLAVAKKLA ELMGGEAGCT SSLGAGSKFW FTVRLKVLAG SC