Gene Rcas_4301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_4301
Symbol
ID	5541812
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	5548521
End bp	5550260
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	58%
IMG OID	640896407
Product	integral membrane sensor signal transduction histidine kinase
Protein accession	YP_001434345
Protein GI	156744216
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAATCTAT CGATCCGCAC CAAATTGCTG GCAGCGCTCG GCGTTGACCT GATCCTCATG 
CTGGTGCTGG GCAGTTTTGC CCTGCACCAG ATGAGCATTA TGAACCAGAA AGCCGATTTT 
GTCGTCAACC AGACGATCCT TTCGATTGAT CTGGTCAACG CAATGAACGA TGTGCTCCTG 
AATTACCGTA CCCGACAGAT GGAGTACATC CTCAACGCCG CCCCTGCCGA CAAACAGCGC 
ATCGAGAAGG AACTGCTGGA CCTCGAAACG CGCATGGACG GCATTTTCCG CAATTACAGC 
GCCAACTATC AACCGGATGC GACGGAACGC CTGATCTTTG AACAGACGCA GCAGGACTGG 
CAGCGCTACG TGTTTTTGAC ACACACCCAG TTTCTGCCGG CGAATCGCAA CAGCAACACC 
GGGAATGTGC ATCCATCGTT TGGGCGGTTG TCACCGCTGT ATGGCAGCCT GCAAACGAAC 
ATGCAGAAGA TCAGGGCGCA GAGTCAGGCG CGCGCCGAGG CGGCGCGCGC AAGCGTCGAA 
ACGGCGTATT CCACCTCACG CTTTGTGATT GTGAGCGAAA CTATTCTGAC CGTATTCGTC 
TCGGCGGTGA TTGGACTGAC CCTCTCCGGC AATATTGCCC GCCGCATTCG CACGCTGCGC 
GATGCAACCA TTGCCGTTTC CGGCGGCGAT CTGAGCCGGC AGGTGTCGCT GCGCGGCGGC 
GACGAACTGG TGTTGCTGGC GAACAATTTC AACCTGATGG TCGCCAGCCT GCGGCAGCAA 
CGCATGCTGC TCGAAGAGCG CAATGCCGAA CTCTCAGCGA GCCTGGAGAC GCAACAACGG 
TTGATGGAAG ACCTGGTGCA GCGCAAACAG GCGGAGGAAG CGGCGCATCG CGCGCAGGCG 
GCGGCGGAAG CAGCCAGCCA CGCGAAGAGC ATGTTCCTGG CGACGATGAG CCACGAACTG 
CGCACGCCGC TGAACGCGAT CCTGGGGTAT GTTCAGTTAT TGCACCTCGA AGCGCAAATC 
CATGGACGAT CCGAGATGCT CCCCGATCTG GAGCGCATCC GTTCGGCGGG CAAGCATCTG 
CTTACCATCA TCAGCAATAT TCTCGACTTC TCGAAGATTG AGCAGGGCCG GATGAATGTC 
GAGATCGACA CCTTCAATGT GAGCGTGATT GCGCACGAAA TGATCAGCAT TATCGAACCG 
CTGGCGCGCA ATCGCAACAA CACGCTGACC CTCACCTGCC CCCCAGACAT CGGTATGATG 
CAGTCCGATG CGGGCAAAGT GCGTCAAATT CTCTTCAACC TGTTGAGCAA CGCGGTTAAG 
TTTACCGATA ACGGCACGGT GGCGCTGACT ATCGAACGTG AATGTTGTTC TGACGGCGAT 
TGGGTGCGCT TCAGCGTCGC TGACACTGGC ATTGGCATGT CGCCAGAACA ACTGACGCGT 
CTGTTCCAAC CGTTCACACA GGTGCATCAG AGCCACTCGT CGCACGCACA TCGCGGCACG 
GGCCTTGGGC TGGCGCTCAG TCAACAGTTA TGTCGCCTGC TCGGCGGCGA CATTTCGGTC 
ACCAGCGAGG TCGGCAGAGG ATCGGTCTTC ACTGTGCGTT TGCCAGCAGT CATCAGCACT 
GCCCATACCG CCGATGTACG TCTCGATTTT GCGCAACACA TACGAAGCGC GACTCGCCAC 
GACGTGGATC ATGCCACTAC GGCGCCATCA CCGTACACAA CGACAACGCT CAGCGCGTAG

Protein sequence

MNLSIRTKLL AALGVDLILM LVLGSFALHQ MSIMNQKADF VVNQTILSID LVNAMNDVLL 
NYRTRQMEYI LNAAPADKQR IEKELLDLET RMDGIFRNYS ANYQPDATER LIFEQTQQDW 
QRYVFLTHTQ FLPANRNSNT GNVHPSFGRL SPLYGSLQTN MQKIRAQSQA RAEAARASVE 
TAYSTSRFVI VSETILTVFV SAVIGLTLSG NIARRIRTLR DATIAVSGGD LSRQVSLRGG 
DELVLLANNF NLMVASLRQQ RMLLEERNAE LSASLETQQR LMEDLVQRKQ AEEAAHRAQA 
AAEAASHAKS MFLATMSHEL RTPLNAILGY VQLLHLEAQI HGRSEMLPDL ERIRSAGKHL 
LTIISNILDF SKIEQGRMNV EIDTFNVSVI AHEMISIIEP LARNRNNTLT LTCPPDIGMM 
QSDAGKVRQI LFNLLSNAVK FTDNGTVALT IERECCSDGD WVRFSVADTG IGMSPEQLTR 
LFQPFTQVHQ SHSSHAHRGT GLGLALSQQL CRLLGGDISV TSEVGRGSVF TVRLPAVIST 
AHTADVRLDF AQHIRSATRH DVDHATTAPS PYTTTTLSA