Gene Rru_A1881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A1881
Symbol
ID	3835305
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	2179319
End bp	2180329
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	63%
IMG OID	637825980
Product	pyruvate dehydrogenase (lipoamide)
Protein accession	YP_426968
Protein GI	83593216
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID	[TIGR03182] pyruvate dehydrogenase E1 component, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAGCGA CCCGACGCAA ACCCAGGAAC GGATCGTCTC CGGCCACGCC CACGCCCGAC 
GACATCAAAG GCTTCTACCG CGACATGCTG TTGATTCGGC GCTTCGAGGA GAAGGCCGGC 
CAGCTGTATG GCATGGGGCT GATCGGCGGG TTCTGTCATC TCTACATCGG TCAGGAAGCG 
GTGGTCGTCG GCCTGCAGTG TCAGGCCCAT CCCGGTGATT CGATCATCAC CAGCTATCGC 
GATCACGGGC ATATGCTGGC CGCCGGCATG GATCCCAAGG GGGTGATGGC CGAGCTGACC 
GGCCGCCGGG GCGGTTATTC CAAGGGCAAG GGCGGCTCCA TGCACATGTT CAGCAAGGAG 
AACGGCTTTT ACGGCGGTCA CGGCATCGTC GGCGCCCAGG TGCCCTTGGG CACCGGCTTG 
GCCTTCGCCC ACAAGTATCG CGGCGATGGC GGCGTGTGCT TTTGCTATCT GGGCGACGGC 
GCGGCCAACC AGGGTCAGGT CTATGAAAGC TTCAACATGG CCGCCCTGTG GAAGTTGCCG 
GTCATCTATG TGATCGAGAA CAACAAATAC GGCATGGGCA CCTCGGTCGA GCGGGCGAGC 
GCCACCAAGG ATCTGGCCAC CCGCGGCGCC GCCTATGGCA TCCCGGGGAT TTCCGTCAAC 
GGCATGGACG TTCTCGCCGT CAAGGCCGAG AGCGAGGAGG CCGTTGATCG GGTGCGCGCC 
GGCGAGGGGC CGCTGATCCT GGAAATGAAG ACCTATCGCT ATCGCGGCCA TTCGATGTCC 
GATCCGGCGA AATACCGGAC CAAGGAGGAG GTCAGCAAGA TGCGCGCCGA AAGCGATCCC 
ATCGACCACC TGCGCCAGAC TATCGTCAGC GACGCCATCC TCGATGAGGA GGCGTTGAAG 
GAGATCGACA AGGAAATCAA ATCCGTCGTC TCCCAAGCCG CCGAATTCGC CCAGAACAGC 
CCCGAGCCCG ACGCGGCCGA GCTGTACACC GACGTTCTCG TCGAAGCCTG A

Protein sequence

MAATRRKPRN GSSPATPTPD DIKGFYRDML LIRRFEEKAG QLYGMGLIGG FCHLYIGQEA 
VVVGLQCQAH PGDSIITSYR DHGHMLAAGM DPKGVMAELT GRRGGYSKGK GGSMHMFSKE 
NGFYGGHGIV GAQVPLGTGL AFAHKYRGDG GVCFCYLGDG AANQGQVYES FNMAALWKLP 
VIYVIENNKY GMGTSVERAS ATKDLATRGA AYGIPGISVN GMDVLAVKAE SEEAVDRVRA 
GEGPLILEMK TYRYRGHSMS DPAKYRTKEE VSKMRAESDP IDHLRQTIVS DAILDEEALK 
EIDKEIKSVV SQAAEFAQNS PEPDAAELYT DVLVEA