Gene Rleg_3609 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3609
Symbol
ID	8014461
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	3642998
End bp	3643993
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	64%
IMG OID	644826173
Product	KpsF/GutQ family protein
Protein accession	YP_002977393
Protein GI	241206297
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAGAA GAGCGATCAA CCTCGTTGAA AACAGCGTGC TCGAATCGGC AAAACGCACG 
ATAGAGACCG AAAGACGCGG TCTTGAAGCG CTCGAACAGG CTTTTGACAA TGGCTTGGCC 
GGTCCTTTCA CACGGGCGGT CGAAGTGATC AGCGACATCT CCGGGCGCGT CATCGTCACC 
GGCGTCGGCA AGAGCGGGCA TATCGGCGCC AAGCTCGCGG CGACATTCGC TTCGACCGGA 
ACGCCTGCCT TTTTCGTGCA TGCGGCGGAG GCCAATCACG GCGATCTCGG CATGATCGCG 
CGCGACGACG TCGTGCTGGC GATTTCCAAA GGTGGCGAAA GCGCCGAGCT CAAGAGCATC 
ATTTCCTTCA CGCGGCGCTT CTCCATTCCG CTGATCGCGA TCACCTGCAG CGAAGGCTCC 
TCGCTCGCCG CCGCCGCCGA TATCGTCCTT CTGATGCCGA ATGAACAGGA GGCCTGCCCC 
AATGGGCTGG CGCCGACGAC CTCGACGCTG ATGCAGCTTG CCATCGGCGA CGCGCTGGCG 
GTGGCGCTCC TGGAGGCGCG CGGCTTTACC GCCACGGATT TCCACGTCTT CCATCCGGGC 
GGCAAGCTGG GCGCGAGCCT GATGCATGTC GCCGATGTCA TGCATACCGG CGAGCGGCTG 
CCGCTCGTTG CCAAGGGTAC ACCGATGCCG GAGGCGATCA CGGTGCTGTC GCGCAAGCAC 
TTCGGCTGCG TCGGCGTGCT TGATGAGGAT GGGCGGCTCT GCGGCATCGT CACCGAAGGC 
GACATGGCGC GCAACCTGAC GCGCAATCTT GCCGAGCTTA CCGTCGACGA CATCATGACG 
CGGACGCCGA AGACGGTGAA GCCGACGGTG CTGGCGACCG CGGCCCTGGC GCTGCTCAAC 
CAGCATCATA TCGGCGCGCT GATCGTCATC GACGACGACC GCCGGCCGGT CGGGCTGGTG 
CATTTCCACG ACCTGCTGCG GATCGGCGTC GCCTGA

Protein sequence

MNRRAINLVE NSVLESAKRT IETERRGLEA LEQAFDNGLA GPFTRAVEVI SDISGRVIVT 
GVGKSGHIGA KLAATFASTG TPAFFVHAAE ANHGDLGMIA RDDVVLAISK GGESAELKSI 
ISFTRRFSIP LIAITCSEGS SLAAAADIVL LMPNEQEACP NGLAPTTSTL MQLAIGDALA 
VALLEARGFT ATDFHVFHPG GKLGASLMHV ADVMHTGERL PLVAKGTPMP EAITVLSRKH 
FGCVGVLDED GRLCGIVTEG DMARNLTRNL AELTVDDIMT RTPKTVKPTV LATAALALLN 
QHHIGALIVI DDDRRPVGLV HFHDLLRIGV A