Gene Rleg_0445 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_0445
Symbol
ID	8011645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	462121
End bp	463842
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	55%
IMG OID	644823039
Product	Capsule polysaccharide biosynthesis protein
Protein accession	YP_002974293
Protein GI	241203197
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGC ATTTTATTCG CAGGGCGATC AGATTTGCCA AGAGAGTTGT GAGTTCGAAG 
CTGTCGCTGC AACAAAGTTC TGCGCCCGCG GCGGCTCAGC AGTTTTCGGA CTGGCGCCGC 
CATCTCGGCA CGTCCATCGA TTGGAAAAGG GCCTTATCCT CTGTTTCGAA AGGCCAGGAG 
GTTCTTATCG CGACGAGCGT CGGCGGTCTG TCGGCCGCGA CGATCCTCGA AGGAATGCTT 
GGCGTCGCTC TTACCTTGCG CGGTGCGCGG GTTCGCTTTC TCTTATGTGA CGCAGTTCTT 
CCGGCCTGTC TTCACATACA TGCCGGAAAA ATCAGGGATC CGGCCGTCAT CACAGAGTAC 
AGGCTCAACA AGGAAATCTG TCCAGGTTGC ATCGGAAGGG GTAGATCGCA TTACGGCTCT 
CTTGGACTGC CGGTCTCCTA CTACAGCGAC TTCATTTCTG AAGAAGAGAG ACGTGCATTG 
CGCAAGACAG CCCGCGAGAT GCCGGTTTCG GAAATTCGCG GCTTTCGGCT GAAAGATATG 
AATCTGGGCG AGCACGCGAT GGCAGGCACC TTGCGCTTCT TCGCTTCGGG AAACCTCCCG 
GCAACCCAGG AAGCCGAAGA TGTATTGCGG CGCTATTTTG AGGCGGCTCT GATCACGGAG 
ACGGTCATTC AGAGATACCA TGAGCAGTTT TCGCCGGAAG TCGCCGTGTT TCACCATGGT 
ATCTACGTCC CTCAGGGGGT AATCGGGGAA GTCTGTCGTG CCCATGGCAC CCGAGTCGCC 
AACTGGCAGG TCGGCTATCG CAAGAAGACC TTCATTTTCT CGCACAAGGA AACCTACCAC 
CATACTCTGA TAAACGAGTC TACCGACTGC TGGACAGACG TTCCTTGGAG CGAGGCCACG 
GAAAACGAGA TCATGTCCTA TCTCAAGAGC CGCTGGTACG GCAGCAATGA CTGGATATGG 
TTTCATGATC AGCCGAAGCA TGACGCAGAA CTTATCGCCA AGGAGACCGG CATCGACTTT 
TCGAAGCCCA CCATCAGTCT CCTGACCAAT GTCTTTTGGG ATGCGCAACT CCATTTCAAG 
GCCAATGCCT TCAGGGACAT GCTCGACTGG GTGCTGCAGA GTATTGAGTA TTTTAAGGGG 
CGTCCCGATC TTCAACTGGC TATTCGGATC CATCCTGCCG AAGTCCGTGG CGCCATCCCC 
TCACGGCAGC CGCTTGTGGA TGAAATCCGC AAGGTTTATC CGACCCTGCC GGACAATGTT 
TACGTCATAC CGCCGGACAG CCAGGTCAGT ACCTATGTTC TCTGTGAGAA CAGTGACACT 
GTAGTTATCT ATGGGACAAA AACCGGCGTG GAGCTGACCG CCATGGGAAT TCCCGTGGTC 
GTTGCAGGTG AGGCGTGGAT ACGTAATAAG GGCCTCACCA TGGATGCGAC CTCGCCGGAG 
AATTATTTTG ACTTGCTCGA CCGGCTGCCG GTCGGCAAGC GGTTGGACGC CGATACGATC 
AATCGGGCTA GAAAATACGC ATTCCATTTC TTTTTTCGAC GCTTCATCCC TATCGAGTTC 
ATGGAACCAT CGAGCAATGA CGCTCCCTAC GAAATTAGGA TCAACGACCT GCAGGATCTG 
CTTCCGGGCA GGGATGCGGG CCTTGATGTC CTATGCAACG GCATTCTTGA TGGAAGCGAG 
TTCGTGTATC CGGCGGAAAA GTATATCGGG AGAACGCAGT GA

Protein sequence

MSMHFIRRAI RFAKRVVSSK LSLQQSSAPA AAQQFSDWRR HLGTSIDWKR ALSSVSKGQE 
VLIATSVGGL SAATILEGML GVALTLRGAR VRFLLCDAVL PACLHIHAGK IRDPAVITEY 
RLNKEICPGC IGRGRSHYGS LGLPVSYYSD FISEEERRAL RKTAREMPVS EIRGFRLKDM 
NLGEHAMAGT LRFFASGNLP ATQEAEDVLR RYFEAALITE TVIQRYHEQF SPEVAVFHHG 
IYVPQGVIGE VCRAHGTRVA NWQVGYRKKT FIFSHKETYH HTLINESTDC WTDVPWSEAT 
ENEIMSYLKS RWYGSNDWIW FHDQPKHDAE LIAKETGIDF SKPTISLLTN VFWDAQLHFK 
ANAFRDMLDW VLQSIEYFKG RPDLQLAIRI HPAEVRGAIP SRQPLVDEIR KVYPTLPDNV 
YVIPPDSQVS TYVLCENSDT VVIYGTKTGV ELTAMGIPVV VAGEAWIRNK GLTMDATSPE 
NYFDLLDRLP VGKRLDADTI NRARKYAFHF FFRRFIPIEF MEPSSNDAPY EIRINDLQDL 
LPGRDAGLDV LCNGILDGSE FVYPAEKYIG RTQ