Gene Rleg2_1099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1099
Symbol
ID	6979818
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	1120025
End bp	1121545
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	64%
IMG OID	643395811
Product	Ppx/GppA phosphatase
Protein accession	YP_002280619
Protein GI	209548702
COG category	[F] Nucleotide transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0248] Exopolyphosphatase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.09229
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTTGAAT CTGAAGCCCA GGGGCGCCTT CCGGGGATCG CCCCGGTCTC CGTTGTCGAC 
ATTGGATCGA ATTCCATTCG TCTCGTCGTC TACGAAGGCA TGTCCCGCTC GCCGACCATT 
CTTTTCAACG AAAAGGTTCT CTGCGGCCTC GGCAAAGGCA TAGCCGTCAC CGGCAAGATG 
GATGAAGACA GCGTCATCAG GGCTCTGGCG GCGCTGCACC GTTTCAAGGC CCTGTCCGAT 
CAGGCACGCG CCGCCACCAT GTATGTGCTG GCGACGGCCG CCGCCCGCGA GGCGAGCAAC 
GGTCCCGATT TCATCCACCA GGCGGAAACC ATCCTCGGCC GCAAGGTCCG TGTGCTCTCC 
GGCGAGGAGG AGGCGAAATT CGCCTCGCTC GGCATCATCA GCGGCTTCTT CAATCCCGAC 
GGCATTGCCG GCGACCTCGG CGGCGGCTCG CTTGAGCTGA TCGATATCAG GGGCAAGGAG 
TTCGGCAAGG GCATCACGCT GCCGCTCGGC GGCCTGCGCC TGTCGGAATA TGCCGGCGGC 
TCGCTCTCCA AGGCCCGCAC CTTTGCCCGC AAGCAGGTGA AGACCGCAAA GCTGCTGTCG 
AAAGGCGAGG GGCGCACCTT CTACGCCGTC GGCGGCACAT GGCGAAACAT CGCCAAGCTG 
CATATGGAAA TCACCAATTA TCCGCTGCAC ATGATGCAGG GCTACGAGGT ATCGCTTGAA 
GCGATGATGC TGTTCCTCGA ACAGGTGGTG ACCGCGCGCG ATTCGAAGGA GCCTGCGTTT 
CAGGCCGTCT CCAAGCACCG CCGGTCGCTG CTGCCCTTCG GCGCCGTCGC CATGACGGAA 
GTGCTGAGCG CGATGAAACC GTCGGTGATT TCCTTCTCGG CGCAGGGCGT GCGTGAGGGA 
TATCTCTATT CGCTGCTGTC GGAGGCCGAG CGCCGCCTCG ATCCGCTGCT GGCCGCTGCC 
GGCGAGCTGG CGATCCTGCG TGCCCGTTCG CCCGAGCATG CCCGCGAGCT GGCGGAATGG 
ACCGGCCGCA TGATGCCCTT GTTCGGCGTC CAGGAAACCG ACGAGGAAAG CCGCTATCGT 
CAGGCCGCCT GTCTGCTGGC CGATATCAGC TGGCGCGCCC ATCCCGACTA TCGCGGCCTG 
CAGGCGCTGA ACGTCATCGC CCACTCCTCC TTCGTCGGCA TCAGCCATCC TGGCCGCGCC 
TTCATCGCGC TGACCAACTA CTACCGTTTC GAAGGCCTGC ACGATGACGG CGCCACCGGC 
CCGCTGGCGC AGATCGCCAC AGCCCAGTTC ATCGAGCGCG CCAAGCTGCT CGGCGGCATG 
CTGCGCGTCG TCTACCTCTT CTCGGCCTCA ATGCCCGGCA TCGTCAAAAG CCTGAGCTTC 
CGCAAATCGT CGAACCCGGA CCTCGACCTC GAATTCGTCG TGCCGCCCGA ATACCGCGAT 
TTCGCCGGCG AACGCCTGGA CGGGCGCCTG CAGCAGCTGT CGAAGCTGAC GAACAAGAGG 
CTGGCGTTCC GGTTCGAGTA G

Protein sequence

MVESEAQGRL PGIAPVSVVD IGSNSIRLVV YEGMSRSPTI LFNEKVLCGL GKGIAVTGKM 
DEDSVIRALA ALHRFKALSD QARAATMYVL ATAAAREASN GPDFIHQAET ILGRKVRVLS 
GEEEAKFASL GIISGFFNPD GIAGDLGGGS LELIDIRGKE FGKGITLPLG GLRLSEYAGG 
SLSKARTFAR KQVKTAKLLS KGEGRTFYAV GGTWRNIAKL HMEITNYPLH MMQGYEVSLE 
AMMLFLEQVV TARDSKEPAF QAVSKHRRSL LPFGAVAMTE VLSAMKPSVI SFSAQGVREG 
YLYSLLSEAE RRLDPLLAAA GELAILRARS PEHARELAEW TGRMMPLFGV QETDEESRYR 
QAACLLADIS WRAHPDYRGL QALNVIAHSS FVGISHPGRA FIALTNYYRF EGLHDDGATG 
PLAQIATAQF IERAKLLGGM LRVVYLFSAS MPGIVKSLSF RKSSNPDLDL EFVVPPEYRD 
FAGERLDGRL QQLSKLTNKR LAFRFE