Gene Rcas_4343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4343
Symbol
ID	5541856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5594309
End bp	5595979
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	60%
IMG OID	640896449
Product	multi-sensor signal transduction histidine kinase
Protein accession	YP_001434385
Protein GI	156744256
COG category	[T] Signal transduction mechanisms
COG ID	[COG5002] Signal transduction histidine kinase
TIGRFAM ID	[TIGR00229] PAS domain S-box

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.236595
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.180185
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTAGACC GGTATGATCA ACAGTTGCGG CAGCTTGAGT CGCTGCTGCG CGTCAGTCGC 
GCGATCACGG CGCAGCTCGA TCTCACCAGT GTGCTCAATC TGGTCATCGA GGCGGCGGTC 
GATTTGCTTG CCGGCAGCTC CGGCTTGATT GCCCTGCGCG ATGATGATGG CACGACGCGC 
ATTTATGCGG CGTATGGACT GGCGCGCGAA ATCTGGCCCG TGTTCGACGA CCTGCTGGCG 
ACGCCGCTTA GCGATCAGCA GGCGCTGGTG CATCGCCTGC GCGAAGCAGG CGCCAGCATC 
GGGCTGCCAT TACGGCATGT CAGCGCGTTA CCGCTGATGT TTCGCGGCGC GACGGTCGGG 
GTGATCTATG TCTTTCGCGC TGCGCTGAAC GTCGAGTTTA CTGCCGAAGA ACATCAACTC 
CTGACCGCAT TCGCCGATCA GGCGGCGATT GCGGTCTCGA ATGCACGCCT GTTCCAGAGC 
GTCTTGCGTG AGAAACAACA TCTTGATGCG CTGATCGAGA ACAGCGCCGA CGGCGTGATG 
ATCCTCGATG AGCGCTGGCG CATTGCCACA TTCAACCGTG CAATGGAACT GCTGACCGGT 
TGGAGCCGTG AGGAGGCGAT CGGGCGCCCG TGCGCCGAGG TGCTGGCTAT CCACACGCCG 
CAAGGCGCCA ATCTCTGCCT TACCGATTGC CCGTTGCAAC GGCAACCGTT CGAGCCTAAT 
CCGGTCGCCG AGGGGTGGAT CACCACACGG GACGGACGGC GTCTCTACAT CCAGAGTCGC 
TACGCAGCAC AACGCAGCCC GCAGGGCGCG TTTCTTGGCG CCATCGCCAA CGTGCGTGAT 
GTCACCGAGC AGAAGATCGA AGCTGAGATG CAGAACACCT TCATTTCAGT CATCTCGCAC 
GAATTGCGCA CACCGGTCAG CATTATTAAA GGATACGCCG AGACGCTGGC GCGCCAGGAT 
GCGGCATGGG ACGCAGCGAC TCTCCGTGAA GGACTGGCCG TTATCATCGA AGAGGCGGAT 
CGCCTGGCGC AGCAGATCAA CACGCTGCTG GAAGCCTCCC GTTTACAGAC CGACAGTATG 
CGCCTCGAGT TGAGCGACTG GTCGGTACGC CCTCTGGTGG AGCGCGTGGT CGAACGCTTC 
GCACCACAGG CAGGCGACCG GTTCACGTTC CAGATCGACA TTCCCGACGA CTTTCCGCCA 
GTCCATGCCG ATTATGAGCG GACCCGCACC GTGGTGGAGA ATCTGATCAG CAACGCGATT 
AAGTACAGCC CGAACGGTGG GTTGATACGC ATCACGGCGC GGGTGAGCGG CGATTTTGCG 
ATTATCTCGG TGAGCGATCA GGGTATTGGC ATACCGCTCG AAGAGCAGAA AAAACTCTTT 
CGCCGCTTCT ATCGCGTCGA TAACCGCCTG CGGCGTGAAA CGCAAGGAGC AGGATTGGGG 
TTGTTCCTGT CGCGCGTTAT TGTTGAAGCG CAGGGTGGGC GAATCTGGGT CGATAGCCGA 
CCGGGGCGCG GGTCGCGCTT TTCGTTTACT GTGCCGCTGG CAACGCCAAT GCTGAGCGAT 
CAGATGGCGT CGGGTGAGAT CGAAACTGCC ACATCTGTCG ATCATCCTGA GTCAACCGTA 
GTAACGCTTC CACGGATGGA ACCGCCGCTG CTCGAGGATC ATGAACGTTA A

Protein sequence

MLDRYDQQLR QLESLLRVSR AITAQLDLTS VLNLVIEAAV DLLAGSSGLI ALRDDDGTTR 
IYAAYGLARE IWPVFDDLLA TPLSDQQALV HRLREAGASI GLPLRHVSAL PLMFRGATVG 
VIYVFRAALN VEFTAEEHQL LTAFADQAAI AVSNARLFQS VLREKQHLDA LIENSADGVM 
ILDERWRIAT FNRAMELLTG WSREEAIGRP CAEVLAIHTP QGANLCLTDC PLQRQPFEPN 
PVAEGWITTR DGRRLYIQSR YAAQRSPQGA FLGAIANVRD VTEQKIEAEM QNTFISVISH 
ELRTPVSIIK GYAETLARQD AAWDAATLRE GLAVIIEEAD RLAQQINTLL EASRLQTDSM 
RLELSDWSVR PLVERVVERF APQAGDRFTF QIDIPDDFPP VHADYERTRT VVENLISNAI 
KYSPNGGLIR ITARVSGDFA IISVSDQGIG IPLEEQKKLF RRFYRVDNRL RRETQGAGLG 
LFLSRVIVEA QGGRIWVDSR PGRGSRFSFT VPLATPMLSD QMASGEIETA TSVDHPESTV 
VTLPRMEPPL LEDHER