Gene Rleg2_0452 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_0452
Symbol
ID	6979168
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	464191
End bp	465501
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	64%
IMG OID	643395165
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	YP_002279976
Protein GI	209548059
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAACCA ACTTCACCCC CGCCCAACTC GCCGATCCCG ATGTCGCCGA ATCCGAGCAG 
ATTCTGCGCA AATGTGTCCA TTGCGGTTTC TGCACCGCCA CCTGTCCCAC CTATGTGACG 
CTCGGCAATG AGCTCGACAG TCCACGCGGC CGCATCTACC TGATCAAGGA CATGCTGGAA 
AACGGCCGGC CGGCCGATGC CGAGGTCGTT ACCCATATCG ACCGCTGTCT ATCCTGCCTT 
GCCTGCGTCA CCACCTGTCC CTCCGGCGTC GACTACATGC ATCTGGTCGA TCACGCCCGC 
GCCCATATCG AAAAGACCTA CAGGCGCCCG TTGATGAACC GGCTGACGCG GGCGATCCTT 
GCCGCCGTGC TGCCCTATCC CGGCCGCTTC CGCCTGGCGC TCAATCTCGC CCGCCTCGGC 
CGGCCCTTCG CCGGGCTGAT GCGGGGGGCC GCGCTGAAAC CCTTCGCCGC CATGCTGGCG 
CTTGCGCCGC GCCGCATCCC CGCCGCTTCA GATTTCGCAA AACCCGGCAG CTATCTGCCC 
GAAACCGAAC GGCGCGGCCG GGTGGCGATG CTTTCCGGCT GCGCTCAGCC GGTGCTCGAT 
CCCGGTATCA ACGCGGCGGC GATCCGACTG CTGACCCGGC TCGACGTCGA GGTCGTGCTG 
CCGGAAGGCG AGGTCTGCTG CGGCTCGCTG GTCCATCACA TGGGCCGCGC CGAGCAGGCG 
CTCGCCAGTG CGCGAACCAA TGTCGATCTC TGGACGCGCG AGATCGACGG GCAGGGGCTC 
GACGCGATCA TCATCACCGC GTCGGGCTGC GGCACGACGA TCAAGGATTA CGGCCATATG 
CTGCGCCTTG ATCCCGCCTA TGCCGCAAAG GCGGCGAGGG TCTCGGGCCT CGCCAAAGAC 
ATCACCGAAT ATCTGGCAAC CCTCGAGCTG CCGGTGCACA CGCCGAAGGG CATCACGGTC 
GCCTATCACT CCGCCTGTTC CATGCAGCAC GGCCAGCGCA TTACGCTTGC CCCGAAGCAA 
TTGCTGAAAG CGGCGGGTTT CACCGTGCGC GATCCCGCCG AAGGCCATCT CTGCTGCGGT 
TCGGCCGGCA CCTACAATAT CATGCAGCCG GAGATCTCTG CCGCGCTGAA GGCACGCAAG 
GTCAAAAACA TCGAAGCCAC CAAGGCCGAA ATCATCGCCA CCGGCAATAT CGGCTGCATC 
ACCCAGATCG CCACCGGCAC CGGCATGCCG ATCCTGCATA CGGTCGAGCT GCTCGATTGG 
GCCTATGGCG GCGCTGTGCC GGAAAAATTA ACAGGTTTGT CGTTAGGTTG A

Protein sequence

MQTNFTPAQL ADPDVAESEQ ILRKCVHCGF CTATCPTYVT LGNELDSPRG RIYLIKDMLE 
NGRPADAEVV THIDRCLSCL ACVTTCPSGV DYMHLVDHAR AHIEKTYRRP LMNRLTRAIL 
AAVLPYPGRF RLALNLARLG RPFAGLMRGA ALKPFAAMLA LAPRRIPAAS DFAKPGSYLP 
ETERRGRVAM LSGCAQPVLD PGINAAAIRL LTRLDVEVVL PEGEVCCGSL VHHMGRAEQA 
LASARTNVDL WTREIDGQGL DAIIITASGC GTTIKDYGHM LRLDPAYAAK AARVSGLAKD 
ITEYLATLEL PVHTPKGITV AYHSACSMQH GQRITLAPKQ LLKAAGFTVR DPAEGHLCCG 
SAGTYNIMQP EISAALKARK VKNIEATKAE IIATGNIGCI TQIATGTGMP ILHTVELLDW 
AYGGAVPEKL TGLSLG