Gene Rleg_3022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3022
Symbol
ID	8013937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	3016332
End bp	3017432
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	64%
IMG OID	644825590
Product	protein of unknown function DUF185
Protein accession	YP_002976818
Protein GI	241205722
COG category	[S] Function unknown
COG ID	[COG1565] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.838138
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCG CTCTAGGCGA AAAGATCAAG GCGATTATCC AGGCCAACGG CCCGATCAGC 
GTCACCGATT ATTTCTCGCT CTGCCTCGCG GACCCCGAAC ACGGCTATTA CCGCACCCGC 
GAGCCCTTCG GCCGTTCCGG TGATTTCGTC ACCGCGCCCG AGGTCAGCCA GATCTTCGGC 
GAGATGATCG GCGTCTTCAT CGTCCATGCG TGGCAGCGCC ATGGCACACC GACAGACGTC 
CGCCTCGTCG AGATCGGCCC CGGCCGCGGC ACCATGATAT CAGACATGCT GCGCGTCATC 
TCCCGCATCG CTCCACCGCT TTTCGACGTC ATGACCGTGC ATCTTGTCGA AACCAGCGAG 
CGGCTGCGCG ATGTCCAGAG CCAGACGCTC GAACCCCACG GCGAGAAGAT CACCTGGCAT 
AATGGCTTCG ACGAAGTACC TCCCGGCTTC ACGCTGATTG CCGCCAACGA ACTCTTCGAC 
GCCATCCCGA TCCGCCAGTT CGTTCGCATG GCGACGGGTT TTCGCGAGCG CATGGTCGGC 
ATCGACGCCG ACGGCGAGCT GACCTTCGCC CCCGGCGTCG CCGGCATCGA TCCCACGCTT 
CTTCCCGAAC CGGTGCAGAA CGTGCCGGTC GGCACACTCT TCGAGATCTC GCCTGCCCGC 
CAGGCGGTGA TGATGGCGAT CTGCGAGCGG TTGCGCGCCT TCGGCGGCAC GGCGCTTGCG 
ATCGACTACG GCCATCTCGT CACCGGCTTC GGCGATACGC TGCAGGCCGT GCGCATGCAT 
GAATTCGACC CGCCGCTCGC GCATCCAGGC GAAGCCGATC TGACGAGCCA TGTCGACTTC 
CAGCAACTCG CCGAAACAGC GCTTGCGGCT GGCCTCTATC TGAACGGCGC CCTGCACCAA 
GGTGATTTTC TGACCGGCCT CGGCATCCTC GAGCGCGCAA CCGCTCTCGG CCGTGATCGC 
GAGCCGCACA CCCAGCAGGT CATCCAGGCG GCGGTCGAAA GGCTTGCCGG CGCCGGTGAA 
GGCCGGATGG GCGAACTCTT CAAGGTGATG GCGGTCTCTT ATCCCGCCAT CGATCTCATG 
CCCTTTCGTC CGGTGGATTG A

Protein sequence

MTTALGEKIK AIIQANGPIS VTDYFSLCLA DPEHGYYRTR EPFGRSGDFV TAPEVSQIFG 
EMIGVFIVHA WQRHGTPTDV RLVEIGPGRG TMISDMLRVI SRIAPPLFDV MTVHLVETSE 
RLRDVQSQTL EPHGEKITWH NGFDEVPPGF TLIAANELFD AIPIRQFVRM ATGFRERMVG 
IDADGELTFA PGVAGIDPTL LPEPVQNVPV GTLFEISPAR QAVMMAICER LRAFGGTALA 
IDYGHLVTGF GDTLQAVRMH EFDPPLAHPG EADLTSHVDF QQLAETALAA GLYLNGALHQ 
GDFLTGLGIL ERATALGRDR EPHTQQVIQA AVERLAGAGE GRMGELFKVM AVSYPAIDLM 
PFRPVD