Gene Rleg2_1603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1603
Symbol
ID	6980339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	1630116
End bp	1631162
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	62%
IMG OID	643396328
Product	pyruvate dehydrogenase (acetyl-transferring) E1 component, alpha subunit
Protein accession	YP_002281119
Protein GI	209549202
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03182] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0112007
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCCGC GAAAGACCGC GACCGTTTCC AGCCGCAAAA CTGCAGCGAA ACCGGCAGCC 
AAGGCATCGA ATGGAGGCCC GGTAGCCGAC TTCGATCGCG ATGAGGAGCT CAAGGCCTAT 
CGCGAGATGC TGCTGATCCG CCGCTTCGAG GAGAAGGCCG GCCAGCTTTA CGGCATGGGC 
TTCATCGGCG GCTTTTGCCA CCTTTACATC GGTCAGGAAG CTGTCGTCGT CGGCATGCAG 
ATGGCGCAGA AGGAAGGCGA CCAGGTCATC ACCGCCTATC GCGATCACGG CCACATGCTG 
GCAACCGGCA TGGAAGCGCG CGGCGTCATG GCGGAGTTGA CCGGCCGCCG CAGCGGCTAT 
TCCCACGGGA AGGGCGGCTC GATGCACATG TTCTCGAAAG AGAAGCATTT CTACGGCGGC 
CACGGCATCG TCGGCGCCCA GGTTTCGCTC GGAACCGGTC TTGCCTTTGC AAACCATTAC 
CGCGGCAACG GCAATGTCTC GATTGCCTAT TTCGGCGATG GCGCCGCCAA CCAGGGCCAG 
GTCTACGAGA GCTTCAACAT GGCGGCTCTC TGGAAGCTGC CGATCGTCTA TATCGTCGAA 
AACAACCGTT ACGCCATGGG CACCTCGACG GCACGCGCCA CCGCGCAGTC GAACTACTCG 
CTGCGCGGCT CCGGCTTCGG CATTCCCGGC ATCCAGGTCG ACGGCATGGA CGTTCGCGCC 
GTCAAGGCGG CCGCTGACGA GGCGCTCGAA CATTGCCGCT CCGGCAAGGG TCCGATCATC 
CTCGAAATGC TGACCTATCG TTATCGCGGT CACTCCATGT CGGATCCGGC GAAATATCGC 
TCGAAGGAAG AAGTGCAGAA GATGCGCTCC GAGCAGGACC CGATCGAGCA GGTCAAGGCG 
CGCCTCATCG AAAAGGGTTG GGCCTCGGAA GACGATCTGA AGGCGATCGA CAAGGATATC 
CGCGACATCG TCGCCGACAG CGCCGACTTC GCCCAGGCCG ATCCGGAGCC GGATGCATCC 
GCGCTCTACA CCGACATTCT GCTCTAA

Protein sequence

MAPRKTATVS SRKTAAKPAA KASNGGPVAD FDRDEELKAY REMLLIRRFE EKAGQLYGMG 
FIGGFCHLYI GQEAVVVGMQ MAQKEGDQVI TAYRDHGHML ATGMEARGVM AELTGRRSGY 
SHGKGGSMHM FSKEKHFYGG HGIVGAQVSL GTGLAFANHY RGNGNVSIAY FGDGAANQGQ 
VYESFNMAAL WKLPIVYIVE NNRYAMGTST ARATAQSNYS LRGSGFGIPG IQVDGMDVRA 
VKAAADEALE HCRSGKGPII LEMLTYRYRG HSMSDPAKYR SKEEVQKMRS EQDPIEQVKA 
RLIEKGWASE DDLKAIDKDI RDIVADSADF AQADPEPDAS ALYTDILL