Gene Rleg2_1107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1107
Symbol
ID	6979826
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1131202
End bp	1132389
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	61%
IMG OID	643395819
Product	hypothetical protein
Protein accession	YP_002280627
Protein GI	209548710
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.585839
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATTTTT ACCGGACAAC GCGGCTGATG CTGTCGGGCG CCGCCTTTTT CTCGCTCGCC 
GGCTCGGCTT TCGCTCTCGA CGGCACCGAT CTCTTGAAGA AGATCAATGC CGCCTATGCC 
GCCCAGGGTG GGACGATTGC GGCTGAAAGC GTCGATATCG ACGGCACGAC CGTCACGTTG 
AAGAATGTCA CCGTCAAGCC GACCGGCGGC GAGAGCCTGC CCATCGGCGA AATCACCCTT 
TCCGGTGTCG AGGAAGACGA GGATGGCGGC TACTACATCG AGGAAGCCGC CTTCCCCGAC 
ATCAACAAGA CGCAAGACGG CGTGACCGTG ACGGCGCAGG AGCTGACGCT CGGCGGCATC 
TCCGTGCCGG CAACGCCGGG CGGCGACACG CTCGACACCA TGATGCTCTA TGAAACCGCC 
CATATCGGCC CGCTGAAGGT GGTCAAAGAC GGCGCGGAAG TGTTCTCGCT GCTCGAAAGC 
AACATGAACC TGACGCTGCG CGAAGACGAA TCCGGCTTCG ATTTCGACGG CGCCTTCAAA 
AGCATGAAGG CCGACCTCAC CAAGACCGAA GATGCGCAGA GCAAGGATGC GATCGAGAAG 
CTCGCCCTGC AGCACGTCCA AGGCGACATC ACCATGAAGG GCGCCTGGGA GCTCGCCCCC 
GGCACGATCG ACATTTCGGA ATTCGCCTTC GACTTCACCA ATGTCGGGAA GCTGAACCTC 
GGCTTCAAGA TCTCCGGCTA CACGATGGCC TTCATGAAGT CGATGCAGGA TGCGATGAAG 
GAATCCGAAG CCAATCCGAA CAAGGAACAG TCGCAGCAAG CGCTCGGCCT CGCCATGCTC 
GGCCTGATGC AGCAGCTTTC CTTCGAGGCC GCGCAGGTGC GTTTCGACGA TGCCTCGATC 
ACCAAGCGCG CGCTCGATTA TGCCGGCTCG CAGCAGAACA TGTCGGGCAA GCAGATGGCC 
GATTCGCTGA AGGCGATGAC GCCGATCATG CTGGCGCAGC TCAATATCCC GGAACTGCAG 
AATGCCGTTT CGGCTGCCGT CAACACCTTC CTCGACGATC CGAAGAGCCT GACCGTCAAG 
GCCGCTCCCG AAAAGCCGGT GCCGTTCCCG ACGATCGTCG GCGCTGCCAT GGGCGCTCCG 
AACACGCTGC CGCAGGTGCT CGGCGTCAAG GTTTCGGCCA ACGACTGA

Protein sequence

MNFYRTTRLM LSGAAFFSLA GSAFALDGTD LLKKINAAYA AQGGTIAAES VDIDGTTVTL 
KNVTVKPTGG ESLPIGEITL SGVEEDEDGG YYIEEAAFPD INKTQDGVTV TAQELTLGGI 
SVPATPGGDT LDTMMLYETA HIGPLKVVKD GAEVFSLLES NMNLTLREDE SGFDFDGAFK 
SMKADLTKTE DAQSKDAIEK LALQHVQGDI TMKGAWELAP GTIDISEFAF DFTNVGKLNL 
GFKISGYTMA FMKSMQDAMK ESEANPNKEQ SQQALGLAML GLMQQLSFEA AQVRFDDASI 
TKRALDYAGS QQNMSGKQMA DSLKAMTPIM LAQLNIPELQ NAVSAAVNTF LDDPKSLTVK 
AAPEKPVPFP TIVGAAMGAP NTLPQVLGVK VSAND