Gene P9303_16211 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	P9303_16211
Symbol	pdhB
ID	4778398
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. MIT 9303
Kingdom	Bacteria
Replicon accession	NC_008820
Strand	+
Start bp	1420071
End bp	1421054
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	51%
IMG OID	640087130
Product	pyruvate dehydrogenase E1 beta subunit
Protein accession	YP_001017630
Protein GI	124023323
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.220601
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCAGGGA CGCTTCTCTT TAATGCTCTT CGAGATGCCA TCGATGAAGA GATGGCCAGA 
GATTCGCATG TTTGTGTGAT GGGAGAGGAC GTCGGCCAAT ACGGCGGCTC CTACAAGGTC 
ACCAAGGATC TCTACGAGAA ATATGGCGAG TTGCGGGTGT TGGATACACC GATTGCCGAG 
AACAGTTTTA CGGGTATGGC CGTTGGCGCC GCCATGACTG GCCTACGCCC GATTGTGGAG 
GGCATGAACA TGGGTTTTCT GCTGCTTGCT TTCAACCAGA TCTCCAACAA CATGGGAATG 
CTTCGTTACA CCAGTGGCGG AAATTTCACA ATTCCCACCG TGGTGCGTGG GCCTGGTGGT 
GTGGGGCGCC AACTCGGTGC TGAACATAGT CAGCGACTTG AGGCCTATTT TCACGCTGTG 
CCTGGGATCA AGATCGTTGC TTGCAGCACG CCAACCAATG CCAAGGGCTT GATGAAAGCC 
GCGATCCGAG ACAACAATCC AGTTCTCTTT TTCGAGCATG TGCTGCTCTA CAACCTGATT 
GAGGAGCTCC CAGACGGTGA TTATGTCTGT GCCCTAGATC AAGCAGATCT GGTTCGTGAG 
GGTAAAGACG TCACGATCCT CACCTATTCG CGTATGCGTC ATCACTGTCT CAAGGCTGTT 
GAACAGTTGG AGGCAGACGG CATCGATGTG GAATTGATCG ATTTGATTAG TCTCAAGCCC 
TTCGATATGG AGACCATTGT TCGCTCCATC CGTAAAACCC ATCGGGTGAT TGTGGTTGAG 
GAGTGTATGA AAACTGGTGG GATTGGTGCT GAGTTGATTG CGCTGATTAC TGAGCAGTGT 
TTTGACGAAC TCGATGCTCG CCCAATTCGC CTCTCCAGTC AGGACATTCC CACTCCATAT 
AACGGCAAAT TGGAGAATTT CACGATCATT CAGCCTCATC AGATTGTTGA AGCGGCTCAG 
CAGATTGTTC TTAAGGGGCT TTGA

Protein sequence

MSGTLLFNAL RDAIDEEMAR DSHVCVMGED VGQYGGSYKV TKDLYEKYGE LRVLDTPIAE 
NSFTGMAVGA AMTGLRPIVE GMNMGFLLLA FNQISNNMGM LRYTSGGNFT IPTVVRGPGG 
VGRQLGAEHS QRLEAYFHAV PGIKIVACST PTNAKGLMKA AIRDNNPVLF FEHVLLYNLI 
EELPDGDYVC ALDQADLVRE GKDVTILTYS RMRHHCLKAV EQLEADGIDV ELIDLISLKP 
FDMETIVRSI RKTHRVIVVE ECMKTGGIGA ELIALITEQC FDELDARPIR LSSQDIPTPY 
NGKLENFTII QPHQIVEAAQ QIVLKGL