Gene Rleg_5060 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5060
Symbol
ID	8007653
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	+
Start bp	442648
End bp	444051
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	65%
IMG OID	644821975
Product	histidine kinase
Protein accession	YP_002973235
Protein GI	241113400
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0718016
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.845094
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGTA GCCTCGTTAC AAAGGTCGGC GCGGCGATCG CGCGGCTCAG CCACAGCTTG 
AGGGTACAAT TGCTCTGCTG GGTGCTGATG ACCCTGTTCG GCGCGATCGG CTTCAATCTT 
TACGACAGCT TCTGGACGGC GGATGCGACG GCAAAGCTGG TGACGGATCG AACACTTCTG 
GCCTCGGCCC GCGTCATTGC CGAGGCCGTC CGCGTCGACG AGGGCGGCAA TGTCCAGGTG 
GACGTGCCGC CTTCCGCGCT GGAGATGTTT GATACAGGCT TCGGCGACCG GGTATCTTAC 
CAGGTGATCA CCGCGTGGGG CAGTCTGGTC AGCGGCTTTC CCGACTTGCC GTTGCCGGCC 
GTCCAGCGGG CAGGCGCCGA TCGCGCGTTC CATGGTGCCG ATGTGCGTGT CATGATGCTC 
GACCATCCTG TCGTCGGCCT GCCCGATGAC GGCACGATCT CCGTGACCGT CGCCGTTACG 
CATAACAGCC AGTATGCGAT GCGACGGCAA TTGTGGCTTT CGGACTTTTC GAAGCAGTTC 
GTGCTCGTCT TCGTCGCGAG CCTGGTGACC ATCCTCGGGC TTCAACGGGG TCTGGCGCCC 
GCTCTGAGAC TGCGGGACGC CGTGCGCCAG CGCGGCCGCC ATCGTCTTGA TCCGCTGCCG 
TCGGAAATGG TGCAGAGCGA ACTGCAGCCG CTCGTCCATG CCCTGAACGA CCATATGGAG 
CGCGTCCAGA ACCAGATGGC CGCGCAGCGA CGGTTCGTAT CGAATGCCGC GCATCAGCTC 
CGAACGCCGC TCGCGCTGAT TTCGACGCAG GCGAGCGTGG CGGCCCGGGA AGCTGATCCG 
GCTCGCCGTG ACGAGGCGCT TGTCGCCCTT CGCACCAGCA CGAAGCAGAT TTCGCGTCTC 
GCCAGCCAGC TTCTTACCTT GTCGCGGGCC GAGCCCGGAA GCCGGCGCCC GCGCAGCGAT 
GCGACAGACC TCAGCAAGGC TGCCCGCGAG ATCCTGGAAG CGCATGCCGA AGAGGCGCTC 
AGGCGTAACA TCGACGTCGG TCTGGAAGCG GTCCGCCCGG TCATTGTCGA CGGCGACGCG 
ACGATGTTGC GCGAGATGTT GGTCAACCTC ATAGACAACG CGATCCGCTA TACCCGCCCG 
AATGGACGGG TGACCGTCGC CGTCGGGCAG GCGGACGGCA ATGCCGTCGT GACCGTCGAG 
GACAACGGGC CGGGTATTCC GAGCGGGGAG CGCGAGCAGG TTTTCGAACG GTTCTACCGG 
ATCATGGGGA CCGAAGCTGA GGGGAGCGGT CTGGGGTTGT CGATCGTTCG GGAGGTTGTC 
GAAGGTGCAG GAGGTTCAGT CTCGCTCGAT GATGCGGAAG GCGGCGGCGG GCTCATCGTG 
ACGGTACGGC TTCCGCTCGC TTAA

Protein sequence

MSSSLVTKVG AAIARLSHSL RVQLLCWVLM TLFGAIGFNL YDSFWTADAT AKLVTDRTLL 
ASARVIAEAV RVDEGGNVQV DVPPSALEMF DTGFGDRVSY QVITAWGSLV SGFPDLPLPA 
VQRAGADRAF HGADVRVMML DHPVVGLPDD GTISVTVAVT HNSQYAMRRQ LWLSDFSKQF 
VLVFVASLVT ILGLQRGLAP ALRLRDAVRQ RGRHRLDPLP SEMVQSELQP LVHALNDHME 
RVQNQMAAQR RFVSNAAHQL RTPLALISTQ ASVAAREADP ARRDEALVAL RTSTKQISRL 
ASQLLTLSRA EPGSRRPRSD ATDLSKAARE ILEAHAEEAL RRNIDVGLEA VRPVIVDGDA 
TMLREMLVNL IDNAIRYTRP NGRVTVAVGQ ADGNAVVTVE DNGPGIPSGE REQVFERFYR 
IMGTEAEGSG LGLSIVREVV EGAGGSVSLD DAEGGGGLIV TVRLPLA