Gene Rleg_4804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4804
Symbol
ID	8007488
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	174477
End bp	175817
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	60%
IMG OID	644821734
Product	histidine kinase
Protein accession	YP_002972994
Protein GI	241113159
COG category	[T] Signal transduction mechanisms
COG ID	[COG0642] Signal transduction histidine kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.631947
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.828013
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACAT CGCTGCGCTT CAGGCTTGCG GCCGGCGCAG TTGTCGCCGT CGCCGTCGCT 
TTGGCGCTCG TCTGGCTTGT GCTTGGCCAC CTTTTCGAGG AATATTTGGA GGACCAGTAT 
ACGCATGAAA TGGCCGCCGT GGCCGATGCG CTCGGTGCGC GGCTCGTTGT CGACCAAGGG 
CTGCTTGCCC TAACCAGCAA GCCTCCCGAC CCTCGTTTCG AGAATCCGAT AGGTGGGCGC 
TACTGGCAGA TTTCTCCGGC CGGCGATCAG CCTCCAATTC GTTCGCGCTC CCTGTGGGAC 
GAACAACTCT CGCAAGATGC CTTCGCCAAG GAGCTTTATT GCGGTTTCCT TCAGGCCGAG 
GGTCCCGACG GCAGCCCTAT TCTGGTGTCG ATCAAGGACA TGTCGATCGG CGAGGGCACA 
AATAAAAGGC AATTCAAAGT ATATGCGGCT TTCTCCAAGG AGGAAATGGA AGCGGCACTT 
GAGACCTACC ATCGCCCACT CAGGTTGATG TTGCTGGCAA CGGGGTTGCT TCTGTTGCTC 
GCAGCCTTTC TGCAGGGATT GATCGGCTTG AAACCCCTCG CCCGTCTCCA GCGGGAGGTG 
GCTGATGTTC GAGCCGGCCG CAGAGCCCAT ATCACCGCGA AAGGACCGAG CGAGGTCAAT 
CCGCTCGTGA ACGAGATCAA TCTTCTGCTT AATGAGCGCG AAACCGCCGT AGAGCGCGCG 
CGAGCACGCG CAAGCGACCT GGCCCATGGA TTGAAGACGC CGCTGACAGT CCTTTCCCAT 
CTGGTCGAAG GGCTGCCGCA GGACCGGCGC GATACCGCCT TAAAGCAAAT CGAACTCGTT 
CGCCAACGCG CAGATCGCCA GTTACAGGCC GCGAGAATGG GGGTGGAGCA AATGGCGACC 
ACCTCCGTGC TTGGGATCGC CGGAAAGCTG GTCAACGTCC TTTCGCCGAT GACCGACAGC 
AAGGGGATCG ATTGGACCAT CGACATCGAC TCGGGAATGA CCGTTCAGGC AGATCCGGCC 
GATGTTGCGG AGGCGATCGG CAATATCCTG GACAACGCCG TGCGATTCGC ACACCGGCGA 
ATATCGCTTT CCGCCTCGAA CGACGGACAG AGGGTGATCG TTCGTATCGG CGACGATGGA 
CCCGGCGTCG ACACAAGGCA GCACAAGAGC ATGCTGAAGC GCGGTGAGAC GGATGCGGAT 
TTCGGTCATG GCCTCGGCCT GGCGATATCA AGCGATATCG CTGCAGCCTA TGGAGGTGAA 
CTGAAGTTCG GGCAATCGCC TCTTGGCGGT TTGGAGGCTA GGTTGAGCTT GCCGGCACGA 
AGCCTTGAGA CGGCCGGCTA G

Protein sequence

MITSLRFRLA AGAVVAVAVA LALVWLVLGH LFEEYLEDQY THEMAAVADA LGARLVVDQG 
LLALTSKPPD PRFENPIGGR YWQISPAGDQ PPIRSRSLWD EQLSQDAFAK ELYCGFLQAE 
GPDGSPILVS IKDMSIGEGT NKRQFKVYAA FSKEEMEAAL ETYHRPLRLM LLATGLLLLL 
AAFLQGLIGL KPLARLQREV ADVRAGRRAH ITAKGPSEVN PLVNEINLLL NERETAVERA 
RARASDLAHG LKTPLTVLSH LVEGLPQDRR DTALKQIELV RQRADRQLQA ARMGVEQMAT 
TSVLGIAGKL VNVLSPMTDS KGIDWTIDID SGMTVQADPA DVAEAIGNIL DNAVRFAHRR 
ISLSASNDGQ RVIVRIGDDG PGVDTRQHKS MLKRGETDAD FGHGLGLAIS SDIAAAYGGE 
LKFGQSPLGG LEARLSLPAR SLETAG