Gene Daro_3147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3147
Symbol
ID	3567648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3386130
End bp	3387566
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	60%
IMG OID	637681618
Product	sensor histidine kinase
Protein accession	YP_286347
Protein GI	71908760
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	0.0895878
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGGAA CTGAACCGAC GCCTGAAGAT TCAGGCGCCA AGGAGCACAA TCAGGGACTG 
GCCCGCTCAC TATTCCGGGT CTCGCTACCG CGCTGGCGTG GCAGTCGCTA CAGCCTGTCC 
AAGCTGTTCT TCAATTTCTA CCTGCTGGCG ATGGGCTCCT TCGTCGCCAT CGCCTTTACC 
GCCGACTTCG TCATCTCTAC CGCCCAGCGC GGCATTACCG ATGATTACGC GCGGCGCTTC 
ATGCGCGGCA CGATTACGCT GATTGAAGAT GAACTGTTCC ACCATCCGCG CCGGGAATGG 
CAGAAAAAGA TCAAGGATAT CGACGAGAAA TTCTCCTACA ACCTGGGCAT CGTCGAACGG 
ATCACGCTCG ATAGCAAACT GACCCCCTCT CAGGTGATCA AGCTCGACGC CGGCGATATC 
GCCATCGACC ATGATGGCGA CATCATGTAT CACCGACTCG GCACATCGAG CCAGGTTCTC 
GTCGTCGGCC CGCTGGCATC GAATCGTAAT CCCGAACTAA AAGACCGCCT GCCGCTCGAA 
TTACGGCTGC GCCTGCTGAC CTGGAGCCTG ATTGGCGTCA TTTTCGCCAT CGCTCTCTGG 
TTCTGGATTC GCCCCATCTG GCGTGACCTT GAAGCGCTGC GCCAGACGGC CCGCGATCTC 
GGTGACGGCC ATTTCGATGC CCGCTCACCG GCCGCCCGCA CGCAGCTCTT TGCCCCGCTT 
TCCGACACCA TGAACAGCAT GGCAGACCGT ATACGACAGC TGCTGGCCAC TCATCGCGAA 
CTTTCCTGCG GTATCTCGCA CGAGCTGCGC ACGCCGATTG CCCGCATGCG TTTTGCCCTG 
GAAATGCTGT CCGAAACCGA GCAACGCGAT GAGCGCGAAC GCCTGTGGGC CATGATGGAA 
GCTGACCTCG ACGAGCTCGA CCAGCTGATC GATACCAGTC TGACCTACGC CCGCTTCGAG 
CGCGAAGCGC CGCAAGCGCA CTTTTCCAGC GTCAAATTCG CCGAGTGGCT AAGCGACGAA 
GTCGACGCGG TCCGCCTGCT GGGCCGTCAG CTTGAGGTGG TCGTCGATAC CGGAAAACTG 
CCAGAAAACC TGTTCGTCGA TCTTGACCGC AAGGCGATGC CCTACGCCCT GCGCAACCTG 
CTGCGCAATG CCTTCAAATA CGCCAGCAAG CGTATCTCGG TCAACGCGGA GCTGGTTGGC 
GAAAATATAC AGATCCACGT CGACGACGAT GGCATCGGCA TTCCGCTGGA AGAGCGCGAA 
CACATCTTTT CAGCCTTTAC CCGCCTCGAC CGTTCACGCG ACCGATCGAC GGGCGGCTAC 
GGCCTGGGTC TGGCCATTGC CCGTCGCGTA CTGGAGTTGC ATGGCGGCAC CGCCATTGCC 
GACGCTTCTC CTCTCGGCGG CGCCCGCTTT ACGCTGTCCT GGAAGGCGCA GCAGTAG

Protein sequence

MTGTEPTPED SGAKEHNQGL ARSLFRVSLP RWRGSRYSLS KLFFNFYLLA MGSFVAIAFT 
ADFVISTAQR GITDDYARRF MRGTITLIED ELFHHPRREW QKKIKDIDEK FSYNLGIVER 
ITLDSKLTPS QVIKLDAGDI AIDHDGDIMY HRLGTSSQVL VVGPLASNRN PELKDRLPLE 
LRLRLLTWSL IGVIFAIALW FWIRPIWRDL EALRQTARDL GDGHFDARSP AARTQLFAPL 
SDTMNSMADR IRQLLATHRE LSCGISHELR TPIARMRFAL EMLSETEQRD ERERLWAMME 
ADLDELDQLI DTSLTYARFE REAPQAHFSS VKFAEWLSDE VDAVRLLGRQ LEVVVDTGKL 
PENLFVDLDR KAMPYALRNL LRNAFKYASK RISVNAELVG ENIQIHVDDD GIGIPLEERE 
HIFSAFTRLD RSRDRSTGGY GLGLAIARRV LELHGGTAIA DASPLGGARF TLSWKAQQ