Gene Rleg_3166 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_3166
Symbol
ID	8014065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	3166987
End bp	3168396
Gene Length	1410 bp
Protein Length	469 aa
Translation table	11
GC content	60%
IMG OID	644825732
Product	protein of unknown function DUF404
Protein accession	YP_002976960
Protein GI	241205864
COG category	[S] Function unknown
COG ID	[COG2308] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.839276
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.725586
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCATTTG ATGAAATGAT TACCGGGGAC GAAAGCCCTC GCCCGCCTTA CGACAAATAC 
TTCGAGTGGT ACAACAGCCA AGACCGGGCG CATCTGATTG CCAAGTCCCG CGATGCGGAA 
AACATCTTCC GGAAGACCGG CATCACCTTC GCGGTCTACG GCCATGCCGA CAGTTCCGAA 
AAGCTCATCC CCTTCGACAT CATTCCCCGC ATCATCTCCG CCCGCGAATG GCGCAAGCTC 
GCCCAAGGCA TCGAGCAGCG GGTGATCGCG CTCAACGCCT TTCTCGACGA TATCTACCAT 
AAGCAGGAGA TCATCCGCGC CGGCCGCGTT CCGCGTGAGC TGATCGAGAA TAACGTCACC 
TTCATCCCCG AAATGATCGG TTTCCGGCCG CCCGGCGGCG TCTATACCCA CATCGTCGGC 
ACCGACATCG TGCGCACCGG AGAGGACCAG TTTTACGTGC TGGAGGATAA TGCCCGCACG 
CCCTCCGGTG TCAGCTACAT GCTGGAAAAC CGGGAAACCA TGATGCAGAT GTTCCCTGAG 
CTCTTTCATG AGAACAAGGT GCAACGTGTC GAGGATTATC CCTACCTGCT GCGTCAGAGC 
CTCGCCTCGC TTGCCCCTCC CGGCTGCAAG GGCAAGCCGC GCGTCGCCGT GCTGACGCCG 
GGCATTTACA ATTCCGCGTA TTACGAGCAT TCGTTCCTCG CCGACATGAT GGGCGTCGAA 
CTGGTCGAAG GCGCGGATCT GCGCGTCATC GACGGCAAGG TGAAAATGAG GACGACACGC 
GGTTACGAGG CGATCGACGT GCTCTACCGC CGCGTCGACG ATGACTTCCT CGATCCCCTG 
ACCTTCCGGT CCGATTCCGC GCTCGGCATT CCCGGCATCA TGGATGTCTA CCGCTCCGGC 
AACATCACCA TCGCCAATGC GCCGGGCACC GGCATTTGCG ACGACAAGGC GATCTACTCC 
TATATGCCCG AGATCGTCGA ATTCTATACC GGCCGCAAGG CGCTGCTCGA AAACGTGCCG 
ACCTGGCGCT GTTCGGAAGC CGACAGCCTG AAATATGTGC TGGAACACCT GGAAGAGCTG 
GTGGTCAAGG AGGTGCACGG CTCCGGCGGC TACGGCATGC TGGTCGGCCC GACGGCATCG 
AAGAAGGAGC GCGCCGATTT CGCCGAAAAG CTGAAGGCCA AACCGAACAA TTACATCGCC 
CAGCCAACGC TGTCGCTCTC CACGGTGCCG ATCCTCGTCA ACAAGGGCAT TGCGCCGCGC 
CATGTCGACC TTCGCCCCTA TGTGCTTGTA TCCGACAAGG TGCAGATCAT TCCGGGCGGG 
CTCACCCGCG TAGCGCTGAA GCAGGGCTCG CTGGTGGTCA ATTCCAGCCA GGGCGGCGGC 
ACCAAAGACA CTTGGGTATT GGAGGACTGA

Protein sequence

MAFDEMITGD ESPRPPYDKY FEWYNSQDRA HLIAKSRDAE NIFRKTGITF AVYGHADSSE 
KLIPFDIIPR IISAREWRKL AQGIEQRVIA LNAFLDDIYH KQEIIRAGRV PRELIENNVT 
FIPEMIGFRP PGGVYTHIVG TDIVRTGEDQ FYVLEDNART PSGVSYMLEN RETMMQMFPE 
LFHENKVQRV EDYPYLLRQS LASLAPPGCK GKPRVAVLTP GIYNSAYYEH SFLADMMGVE 
LVEGADLRVI DGKVKMRTTR GYEAIDVLYR RVDDDFLDPL TFRSDSALGI PGIMDVYRSG 
NITIANAPGT GICDDKAIYS YMPEIVEFYT GRKALLENVP TWRCSEADSL KYVLEHLEEL 
VVKEVHGSGG YGMLVGPTAS KKERADFAEK LKAKPNNYIA QPTLSLSTVP ILVNKGIAPR 
HVDLRPYVLV SDKVQIIPGG LTRVALKQGS LVVNSSQGGG TKDTWVLED