Gene Rpal_4446 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_4446
Symbol
ID	6412130
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	-
Start bp	4775551
End bp	4776528
Gene Length	978 bp
Protein Length	325 aa
Translation table	11
GC content	66%
IMG OID	642714328
Product	dehydrogenase E1 component
Protein accession	YP_001993417
Protein GI	192292812
COG category	[C] Energy production and conversion
COG ID	[COG1071] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCCGG AGACCTCGCG CCGCCTGTTG TTCGACATGC TGCGGATCCG CAGCGTGGAG 
GAGACCATCG CGGCGCGCTA CGGCGAGCAG AAGATGCGCT GCCCGACGCA TCTGTCGGTC 
GGGCAGGAGG CCGTCTCTGC GGCGGCCGGG GCGGTGCTGA GGCCGACCGA TCTTGCAGTC 
AGCGGTCATC GCGCCCACGC GCACTATCTT GCCAAGGGCG GATCACTGAA GGCGATGATC 
GCCGAGATCT ACGGCAAGGT CACCGGCTGC GCCCGCGGCA AAGGCGGCTC GATGCATCTG 
GTCGACGAGA GCGTCGGCTT CATGGGCTCG ACCGCGATCG TCGGCGGAAC GGTGCCCGTC 
GGCGTCGGGC TGTCGTATCC GATGAAGCTG AATCAGACGG GTCAGATTTC CTGCGTGTTT 
CTTGGCGACG CGGTTCCGGA AACCGGCGTG TTCTTCGAGT CGGTGAACTT CGCGGTCGTG 
AAGCAGCTCC CGGTGTTGTT CCTGTGCGAG AACAATGGCT ACTCGGTGTA TTCGCCGCTG 
TCGGTGCGGC AGCCGCCCTG CCGCAAGCTG TACGAGCTTG TCGCCGGCTT CGGCCTCAAG 
ACGCATCACG GCGACGGCAA TGATGCGCGC GCCGTGTATG CCGCGCTGAG CGAAGGCGTT 
GCGGCGATCC GGGCCGGCGA GGGGCCGCGG TTCTACGAAT TCGAGACCTA TCGCTGGCGC 
GAGCATTGCG GCCCGATGTA CGACAACGAT CTCGGCTATC GCACGGCGTC CGAATTCGAG 
GCGTGGAAGC TACGCGATCC GGTGCCGACG CTGCAGCGCG CGCTGATCAC CGAAGCTATC 
GTGACCGCCG CCGACGTCGC CGACATGCAG GCGGAGATCG ATGCCGAGAT CGAGGAGGCG 
TTCGCCTTCG CAGAGAGCTC GCCGTTTCCG CCGCCCGAAG ACGCCTTCAC CGACGTCTAT 
GCGTCAGCAG CAGGCTAA

Protein sequence

MNPETSRRLL FDMLRIRSVE ETIAARYGEQ KMRCPTHLSV GQEAVSAAAG AVLRPTDLAV 
SGHRAHAHYL AKGGSLKAMI AEIYGKVTGC ARGKGGSMHL VDESVGFMGS TAIVGGTVPV 
GVGLSYPMKL NQTGQISCVF LGDAVPETGV FFESVNFAVV KQLPVLFLCE NNGYSVYSPL 
SVRQPPCRKL YELVAGFGLK THHGDGNDAR AVYAALSEGV AAIRAGEGPR FYEFETYRWR 
EHCGPMYDND LGYRTASEFE AWKLRDPVPT LQRALITEAI VTAADVADMQ AEIDAEIEEA 
FAFAESSPFP PPEDAFTDVY ASAAG