Gene Rleg2_1901 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1901
Symbol
ID	6980640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	1945208
End bp	1946374
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	66%
IMG OID	643396624
Product	aminotransferase class V
Protein accession	YP_002281412
Protein GI	209549495
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1104] Cysteine sulfinate desulfinase/cysteine desulfurase and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00391908
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGCCGC CACGCCTTTA TCTCGACTGG AATGCCACAG CGCCGCTGCA CCCTGCAGCA 
CGCGAGGCGA TCATGCGCGC CATCGACATA TTCGGCAATC CGAATTCCGT TCACGGCGAA 
GGCCGTGCCG CCCGCGCCGC AATCGAATGT GCACGGCGCA AAGTGGCGGC GCTGGTCGGC 
ACCGACGCCG GCAATGTGAT CTTTACCAGC GGCGCCACCG AGGCCGCCAA TCTGGTGCTG 
ACACCGGATT TCCGCATGGG CCGCACGCCG CTTCAGCTCG GCCGCCTCTA CTTCTCGGCA 
ATCGAGCATC CGGCGGTGCG CGAAGGCGGC CGCTTCGCCA GAGAGAAGAT GACCGAGATC 
CCGGTCACGT CAGACGGCAT CGTCGATCTC GATGCGCTTG GTCTGCTGCT TGATGCACAT 
GACAAGGCCG CCGGCCTGCC GATGGTCGCC ATCATGCTCG TCAACAACGA GACCGGCATC 
GTCCAGCCTG TGGAGGCGGC GGCAAAGATC GTCCACGCTC ATGGCGGGCT CTTCGTCGTC 
GATGCCGTTC AGGCGGCCGG CCGCATAGGG CTCGACATCG GCAGGATCGG CGCCGATTTC 
ATGATCGTCT CCTCGCACAA GATCGGCGGG CCGAAGGGTG CCGGCGCGTT GATTGCCCGC 
GGCGAGGCGC TGATGCCGCG GCCACTGATC CAGGGTGGCG GCCAGGAGCG GGGTCACCGG 
TCGGGGACAC AGAATTCACT GGCGCTGATC GGCTTCGGCG CGGCGACGGA AGCTGCATCC 
GACGAGCTCG AGGCACGCAA TGCGGCAATC GGCGCGTTGC GCGAGCGGCT GGAAGCCGGC 
ATGCGTCAGG CGGCAACCGA TGTGGTGATC CATGGCGAAG GCGGCGAACG TGTCGCCAAC 
ACGATCTTCT TCACTTTGCC TGGGTTGAAG GCCGAGACTG GGCAGATCGC ATTCGATCTC 
GAAGGTGTAG CGCTTTCGGC GGGCTCAGCC TGCTCATCCG GCCGGCTCGG CGAAAGCCAT 
GTGCTGACGG CGATGGGGCG CGACGCCAAG CTCGGGGGCT TGCGTATCTC GCTCGGCTTT 
TCGACGACGG AAGAGGATAT CGACCGGGCG ATTGCCGCTT TTGCGAAGAT CGCCTGCCGG 
CGCAGGTCGG CGGGCGAGGC GGCCTGA

Protein sequence

MAPPRLYLDW NATAPLHPAA REAIMRAIDI FGNPNSVHGE GRAARAAIEC ARRKVAALVG 
TDAGNVIFTS GATEAANLVL TPDFRMGRTP LQLGRLYFSA IEHPAVREGG RFAREKMTEI 
PVTSDGIVDL DALGLLLDAH DKAAGLPMVA IMLVNNETGI VQPVEAAAKI VHAHGGLFVV 
DAVQAAGRIG LDIGRIGADF MIVSSHKIGG PKGAGALIAR GEALMPRPLI QGGGQERGHR 
SGTQNSLALI GFGAATEAAS DELEARNAAI GALRERLEAG MRQAATDVVI HGEGGERVAN 
TIFFTLPGLK AETGQIAFDL EGVALSAGSA CSSGRLGESH VLTAMGRDAK LGGLRISLGF 
STTEEDIDRA IAAFAKIACR RRSAGEAA