Gene P9303_21291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_21291
Symbol	pdhC
ID	4777128
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	-
Start bp	1893868
End bp	1895187
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	57%
IMG OID	640087637
Product	branched-chain alpha-keto acid dehydrogenase subunit E2
Protein accession	YP_001018129
Protein GI	124023822
COG category	[C] Energy production and conversion
COG ID	[COG0508] Pyruvate/2-oxoglutarate dehydrogenase complex, dihydrolipoamide acyltransferase (E2) component, and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.372749
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGCTC TGAGCTCAAC GATGACGGAG GGCAAGATCG TTGAGTGGCT TAAGCAACCT 
GGCGACAAGG TTGGGCGTGG TGAGTCGGTG CTTGTGGTGG AGTCAGATAA AGCGGATATG 
GATGTGGAGT CATTTCAAGA TGGCTACTTG GCCGCGGTCT TGATGCCTGC TGGTCGTTCG 
GCTCCAGTGG GTGAAACGAT TGGTTTGATC GTTGAAAGTG AGGCCGAAAT CGCGGCTGTT 
CAGGCCAATG CCCCTGCTGC GCCAGCGTCT GATCCTGCCC CTCTCAAGGC CGCTGCAAAA 
GTTGTCGATG ACCATGCCCC AGCATCTACT CCGGCGCCCG TCGTGGAGAG TCCCCCTGTT 
GCTGCGCCGC CGCCTGTTAC CAGCCAAGCA GTAGAGAGTG ACAAACGCAT CGTTGCTTCC 
CCGCGGGCTA AAAAACTTGC TGCGCAGATG GGTGTTGATC TGGCCAAGTT GAGAGGTAGC 
GGACCCCATG GCCGTATCCA GGCTGAAGAC GTGCAGCTGG CTGCAGGTCA GCCGATCAGT 
GTGCCTCAGG TTGCTGAAGG AAACGCTTCT TTCGCAACGA CGCATGCAAC TTCTGCAGGC 
GTTGCTCATG CAGTGTCATC TCCTGTAGGT CAGAGCTTTG GGGCCCCGGG AGAAACCGCA 
GCCTTCAACA ACCTCCAACA AGCGGTCAAC CGCAATATGG AGGCCAGTTT GGCCTTCCCC 
TGCTTCAGGG TTGGCTACAC GATCACGACT GATCAGTTGG ATGCTTTTTA CAAGCAGGTG 
AAGCCTAAGG GCGTCACGAT GACAGCCCTT CTGGCCAAAG CCGTGGCCTT GACGCTTGTG 
CGTCATCCCC AGGTGAATGC TGCCTACAGC ACTGCTGGGA TGGTTTATCC AGAGCAGGTG 
AATGTTGCTA TTGCAGTGGC GATGGACGAT GGCGGTCTGA TTACACCGGT TTTGCAGAAT 
GCTGATCGCA CTGATCTCTA TGAGATGTCG CGGCAGTGGG CCGATCTTGT GAAGCGTTCA 
CGCAGCAAGC AGCTGCAACC CGAGGAATAC AGCACTGGTA CTTTCACACT CTCCAATCTG 
GGCATGTTTG GTGTGGATCG CTTTGATGCA ATCTTGCCCC CTGGCACTGG CGCAATTTTG 
GCGGTAGCTG CATCGCGGCC TGCTGTGGTG GCAGGAAAGG ATGGCTCGAT TGGGGTCAAG 
CGCCAGATGC AGGTGAACCT CACTGCCGAC CATCGCGTGA TTTATGGCGC CGATGGGGCG 
GCCTTCCTTA AGGACCTGGC AGAGCTGATT GAGACGCGGG TAGAGAGTTT GGCGCTCTGA

Protein sequence

MPALSSTMTE GKIVEWLKQP GDKVGRGESV LVVESDKADM DVESFQDGYL AAVLMPAGRS 
APVGETIGLI VESEAEIAAV QANAPAAPAS DPAPLKAAAK VVDDHAPAST PAPVVESPPV 
AAPPPVTSQA VESDKRIVAS PRAKKLAAQM GVDLAKLRGS GPHGRIQAED VQLAAGQPIS 
VPQVAEGNAS FATTHATSAG VAHAVSSPVG QSFGAPGETA AFNNLQQAVN RNMEASLAFP 
CFRVGYTITT DQLDAFYKQV KPKGVTMTAL LAKAVALTLV RHPQVNAAYS TAGMVYPEQV 
NVAIAVAMDD GGLITPVLQN ADRTDLYEMS RQWADLVKRS RSKQLQPEEY STGTFTLSNL 
GMFGVDRFDA ILPPGTGAIL AVAASRPAVV AGKDGSIGVK RQMQVNLTAD HRVIYGADGA 
AFLKDLAELI ETRVESLAL