Gene Rleg2_3786 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3786
Symbol
ID	6982549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	3913568
End bp	3914980
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	65%
IMG OID	643398508
Product	protein of unknown function DUF1338
Protein accession	YP_002283274
Protein GI	209551357
COG category	[S] Function unknown
COG ID	[COG5383] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCACG CCTTCGTTTC AACTGACCGT ATCCGCTCGC TCTTCACCGA AGCGATGTCG 
CAGATGTATC GGGCGGAGGT GCCGCAATAT GGCACGCTGA TCGAACTGGT GGCGGATGTG 
AATGCCGGCT GCCTCAAAAA TAATCCCGAT CTGCGCGAAC GGCTTGCCGG CGCCGGCGAA 
CTGGAGCGCA TCGATGTCGA GCGCCACGGC GCCATCCGGC TCGGTACGGC GGAAGAGCTT 
TTCACCATCC GCCGGCTGTT TGCGGTCATG GGCATGCAGT CGGTCGGCTA TTACGATCTC 
TCGGTCGCGG GCGTGCCTGT TCATTCCACC TGTTTTCGGC CGATCGACGA GGCCGCACTC 
AACATCAATC CGTTCCGCGT CTTCACCTCG CTGCTGCGAT TGGAGCTGAT CGAGGACGAA 
GGGCTGCGCG GCGAAGCCGA AGCCATTCTG GCAAAGCGGC GCATCTATAC GCCGCGCGCC 
GTCGCGCTGA TCGAGCGCCA CGAGCAGAAT GGCGGCCTGA CGGAGGCGGA GGTGACGGAG 
TTCGTCGCTG AGTCGCTTGA GACCTTCCGC TGGCATGGCG AGGCGACGGT CAGCGCCGAA 
ACCTACAAGC GCCTGCATGA TGCGCACCGG CTGATCGCCG ACGTCGTCAG CTTCAAGGGG 
CCGCATATCA ACCATCTGAC GCCGCGCACG CTCGATATCG ACGCGGTCCA GGCCCGCATG 
CCGGAACGCG GCATTACGCC GAAGGCCGTC ATCGAAGGCC CGCCGCGCCG CCATTGCGAT 
ATCCTGCTGC GGCAGACGAG CTTCAAGGCG CTTGAAGAAA CGATCGTCTT TGCCGGTGAC 
GCGGACGCGG TTCAAGGAAC GCATACCGCC CGTTTCGGCG AGATCGAACA GCGCGGCGTG 
GCGCTGACGG CCAAGGGCCG GGCGCTCTAT GACCGGCTGC TTGCCTCGGT TCGCGGCGAA 
GTGCAGGTCG GCGCCGGCGG CGCCAAGGCC GGCGCCTATG ACCAGGAACT CGCCGAGCGC 
TTCAAGGCGC TGCCGGACAG CTGGGACGAG CTGCGCAGGC AAGGTCTCGC CTTCTTCCGC 
TATTGCGCGA CGCCTGCGGG TATTGCCGCG GCCGTCGGCG GCACGCTACC CAAGGATCCG 
GAAGCGCTGA TCGCCAAGGG TTACCTTGCC TTCTCGCCGA TCGTCTACGA AGACTTCCTG 
CCAGTCAGCG CCGCCGGCAT CTTCCAATCG AACCTCGGCA CCGACCAGCA GCAGAATTAT 
GCGACGCATT CGAACCGCGA TGCCTTCGAG GCGGCGCTCG GCGCCACCGT TCAGGACGAG 
CTGGCGCTTT ATGCCGAGCG CCAGGCTGCC TCGCTGGATG CGGCGATGGA AGCGCTGGGC 
CTTGCGGGTC TGCAGCTGAA GACCGTCGCG TAA

Protein sequence

MPHAFVSTDR IRSLFTEAMS QMYRAEVPQY GTLIELVADV NAGCLKNNPD LRERLAGAGE 
LERIDVERHG AIRLGTAEEL FTIRRLFAVM GMQSVGYYDL SVAGVPVHST CFRPIDEAAL 
NINPFRVFTS LLRLELIEDE GLRGEAEAIL AKRRIYTPRA VALIERHEQN GGLTEAEVTE 
FVAESLETFR WHGEATVSAE TYKRLHDAHR LIADVVSFKG PHINHLTPRT LDIDAVQARM 
PERGITPKAV IEGPPRRHCD ILLRQTSFKA LEETIVFAGD ADAVQGTHTA RFGEIEQRGV 
ALTAKGRALY DRLLASVRGE VQVGAGGAKA GAYDQELAER FKALPDSWDE LRRQGLAFFR 
YCATPAGIAA AVGGTLPKDP EALIAKGYLA FSPIVYEDFL PVSAAGIFQS NLGTDQQQNY 
ATHSNRDAFE AALGATVQDE LALYAERQAA SLDAAMEALG LAGLQLKTVA