Gene Rleg_0030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0030
Symbol
ID	8011277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	27422
End bp	28471
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	64%
IMG OID	644822620
Product	PhoH family protein
Protein accession	YP_002973880
Protein GI	241202784
COG category	[T] Signal transduction mechanisms
COG ID	[COG1702] Phosphate starvation-inducible protein PhoH, predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.04719
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAACGGAC AAGAATTGGT TTCTTCTTCA CCGCGCCACC CCCGCACGCC GAGCGATACC 
AATCACTTCG TCCTGACGTT CGAGAACAAC CGCTTCGCCA GCGAGCTCTT CGGTCAATTC 
GACCAGAACC TCAAGCTGCT CGAACAACGG CTGAACATCG ATGCGCGGGC ACGCGGCAAT 
TCGGTCGTCA TCACAGGCGA TGTTGTGACC ACCAACCAGG CGCGGCGCAC GCTCGACTAT 
CTCTATGAAA AACTTCAGAA AGGCGGCAGC GTGGAACAAT CCGACGTCGA GGGCGCAATC 
CGCATGGCGG TCGCCGCCGA CGATCAGCTC AGCCTGCCGA CCATGGAGCG CAAAGCCAAG 
CTGACGATGG CGCAGGTTTC CACGCGCAAG AAGACGATCA TCGCCCGCAC GCCGACGCAG 
GACGCCTATA TCAGGGCGCT GGAACGCGCC GAGCTCGTCT TCGGCGTCGG CCCGGCCGGC 
ACTGGCAAGA CCTATCTTGC CGTCGCCCAT GCCGCCCAGC TCCTGGAGCG CGGCGCGGTC 
GAAAAGATCA TCCTGTCGCG CCCGGCCGTC GAGGCCGGCG AACGCCTCGG CTTCCTGCCC 
GGGGACATGA AGGAAAAGGT CGACCCCTAT CTTCGCCCGC TCTATGACGC ACTCTACGAC 
ATGATCCCGG CCGACAAGGT CGACCGGGCG ATCACTGCCG GCGTCATCGA AATCGCGCCG 
CTGGCCTTCA TGCGCGGCCG CACGCTCGCC AACGCCGCCA TCATCCTCGA CGAAGCGCAG 
AACACGACGT CGATGCAGAT GAAGATGTTC CTGACGCGTC TCGGCGAGAA TGCGCGCATG 
ATCGTCACCG GCGACCCGAG CCAGATCGAC CTGCCGCGCG GCGTCAAATC CGGCCTCGTC 
GAGGCCTTGC AGCTTCTGAA CGGCGTCGAG GGAATCTCGA TCGTGCGCTT CACGGATACC 
GACGTCGTCC GCCACCCGCT GGTCGGGCGC ATCGTCAGGG CCTATGATTC CACGTATGCC 
GTCGCCGAAG ACGTCAGCCG GCAGGGCTAA

Protein sequence

MNGQELVSSS PRHPRTPSDT NHFVLTFENN RFASELFGQF DQNLKLLEQR LNIDARARGN 
SVVITGDVVT TNQARRTLDY LYEKLQKGGS VEQSDVEGAI RMAVAADDQL SLPTMERKAK 
LTMAQVSTRK KTIIARTPTQ DAYIRALERA ELVFGVGPAG TGKTYLAVAH AAQLLERGAV 
EKIILSRPAV EAGERLGFLP GDMKEKVDPY LRPLYDALYD MIPADKVDRA ITAGVIEIAP 
LAFMRGRTLA NAAIILDEAQ NTTSMQMKMF LTRLGENARM IVTGDPSQID LPRGVKSGLV 
EALQLLNGVE GISIVRFTDT DVVRHPLVGR IVRAYDSTYA VAEDVSRQG