Gene Rleg_1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1016
Symbol
ID	8012149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1000531
End bp	1001580
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	65%
IMG OID	644823599
Product	hypothetical protein
Protein accession	YP_002974850
Protein GI	241203754
COG category	[S] Function unknown
COG ID	[COG5330] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTGACC GGTTTCGAGA CCTAGAAGGC CCCTTGGCCG TCAGGAAAAA GGACGTGGTG 
TTGATGGCGA CTGTCAGCAG TTTCGAGAAC CTGTCTCATC CGACAAGGTC CGAACTGCGC 
CAATTCGCCG AACTTTTCAT GCCGCTGTTC CAGGCTTCCT CCGACGAGGC CAAGCGCCAG 
GCGGTCGCGG CGCTGTCCCA ATGCCAGAAC ATGCCGGCCG CTGTAGCGCT GTTCATCGGC 
AACCAGCCGA TCGAGATCGC GGCGCCTTTT CTTGCCGCCT CAAAGGCAGT CGCCGACGAC 
ACGCTGATCA CCATCGCGCG CATGCAGGGT GCAGCACATG TCAAGGCGAT CGTCAGCCGC 
GATTCACTCT CGCCGAAGGT CATCGATGCG CTGGTGGCGC TGCGCCAGAG CCAGCCGCGG 
TCCGCGAGCG CATCGGCGCC AGTGATGGAA TCGCCGGCGG TCCCGCTTTC ACCAGCGCCG 
ACTGAGACCA ACGAGGCAGA CGCGCTGGAG GAACAGCGGA TTGCCAATGA AGAGGCGTTG 
CGCGAGCGCA TCCTCGGGCT TGCCGGCCAT CTCGGCCGTG CCGACGAGGA CAGGCTCGGT 
CTGCGCACGC TCACCGACAT TCAAGAGGCG CTGCTGGTGC GCTTCGCCCG TTCGCGTGAG 
GCGACGCATT TCGCAACCGC GCTTGCCGAT GCGCTTTCCG CCAGCCGCTG GCTTGCCGAG 
CGCATCATGC TCGATCTTTC CGGCCAGCAG CTCGCCACGA CGCTGACCAG CCTCGGCATG 
GGCTTTCTCG ACGCCGTCTT CGTGCTCGAA AGGCTCTATC CGCACCTTGC CGAACAGCAG 
CATAACGTCA CGCGCGGCTG GATGGTGCTC GATGCGCTCG ACCCGGAAGA ATGCCACGAA 
CGCGTCGAAG CCTGGCGGCG CGCCGATCGC TACACTTATA AGCCGGAAGC GCCCGCCATG 
CCCGCGCCGG CGGCAACGCC CGACTATCGC TTCATCCGCC AGGCGCCGCC GCAGCGCGAC 
ATGCGCGTCA TGGGACGGCG GTCTCGCTGA

Protein sequence

MRDRFRDLEG PLAVRKKDVV LMATVSSFEN LSHPTRSELR QFAELFMPLF QASSDEAKRQ 
AVAALSQCQN MPAAVALFIG NQPIEIAAPF LAASKAVADD TLITIARMQG AAHVKAIVSR 
DSLSPKVIDA LVALRQSQPR SASASAPVME SPAVPLSPAP TETNEADALE EQRIANEEAL 
RERILGLAGH LGRADEDRLG LRTLTDIQEA LLVRFARSRE ATHFATALAD ALSASRWLAE 
RIMLDLSGQQ LATTLTSLGM GFLDAVFVLE RLYPHLAEQQ HNVTRGWMVL DALDPEECHE 
RVEAWRRADR YTYKPEAPAM PAPAATPDYR FIRQAPPQRD MRVMGRRSR