Gene Rleg2_3866 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_3866
Symbol
ID	6982629
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	4008719
End bp	4009792
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	51%
IMG OID	643398588
Product	protein of unknown function DUF955
Protein accession	YP_002283354
Protein GI	209551437
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2856] Predicted Zn peptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.000000210124
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.0502715
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCTGCG CAGAAAGACT GAAAGTAGCC CGGCATAGGA AGAAGCTATC GGGAAAGCAA 
CTAGCGGAAG CATCTGGTCT TACGGAGGTA ACCGTTTCGA AAGTAGAAAA CGGTCACCAG 
CCTGACGAAG CGACCATAGA AAAGTTGATT AATGCGCTCG GCTACCCCCG CGCATTCTTC 
TTCATGGATA GGCCAGAGAT TCTTGAACCA CGCTCTGTAT CATTTCGTAG TCTAAAGAAA 
ATGAAGGCAG CGGAGCGGAA TGCCTCGCTG GCAGCAGGCT CTAACGGCAT TGCCCTTTAT 
CAATGGGTTG ATGAACGTTT TAAGCTGCCG GCGCCAGACC TCATCGATCT AAGCAGAGAG 
CAGGAGCGAC CGGAAGTGGC CGCACGTCTG CTACGCCAGC ATTGGGGCAT AGGGGATCGT 
CCGATCGGCA ATATCCTGCG ATTATTCGAA TCGAAGGGTA TCAGAGTGCT TTCGCTCTCA 
GAGAACACGC AAAACGTGGA TGCCTATTCC TTCTGGAATG CAGATCATCC TTATATTTTC 
CTCAACCAGA GAAAGACTGC TGAGCGTTCC AACTTCGATG CCGCGCACGA GCTTGGACAT 
TTAGTTTTAC ACTTCCATGC CCAGGCTGAA TCGGCCCCAG AAGACGATGC AGAACGGCAA 
GCAAATCAAT TTGCTTCAGC CTTCTTGATG CCCGAAGCCG ATCTGAAAAA CTCGATTGGT 
CAGATATATA GTTCATCGCA AATTATCAAA GCGAAGGTCC GATGGAAGGT TTCAGCCATG 
GCATTGGCAA TGAGGCTGAA CCAAGCCGGG ATGCTGTCAG ATTGGAACCA TCGGTCAATC 
GTCATTGACC TTGGTCAGAG GGGTTACCGA ACGGGCGAAC CTCTGGGCGT CGAACGGGAG 
GCTTCCACAC TGCTAGCGAA AGTATTTGCT GCGTTGTGGT CTAGAGGGAT CACGAAAAGC 
GACATAGCCA ACGATCTCAA TCTTCCCTGG GACGAGGTCG AATCATTAGT GTTTGGCTTG 
ACAGGCCCAG CCCCGGCACG ACCAGCAAAA GGTAACATCA CACTTATCAA TTAG

Protein sequence

MFCAERLKVA RHRKKLSGKQ LAEASGLTEV TVSKVENGHQ PDEATIEKLI NALGYPRAFF 
FMDRPEILEP RSVSFRSLKK MKAAERNASL AAGSNGIALY QWVDERFKLP APDLIDLSRE 
QERPEVAARL LRQHWGIGDR PIGNILRLFE SKGIRVLSLS ENTQNVDAYS FWNADHPYIF 
LNQRKTAERS NFDAAHELGH LVLHFHAQAE SAPEDDAERQ ANQFASAFLM PEADLKNSIG 
QIYSSSQIIK AKVRWKVSAM ALAMRLNQAG MLSDWNHRSI VIDLGQRGYR TGEPLGVERE 
ASTLLAKVFA ALWSRGITKS DIANDLNLPW DEVESLVFGL TGPAPARPAK GNITLIN