Gene PHATRDRAFT_45333 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_45333
Symbol	6PGDH
ID	7200028
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011674
Strand	-
Start bp	869375
End bp	871526
Gene Length	2152 bp
Protein Length	519 aa
Translation table
GC content	51%
IMG OID
Product	6-phosphogluconate dehydrogenase
Protein accession	XP_002179525
Protein GI	219117461
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0580309
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CATAAAACGG CCATCGCAAC TGCTGTTCAC GAGAACTGTT GCAATCGCGA AGCAATCGCA 
AAAGGTGCGT ACCATGTCTC CACACACCGG AACAGTACAG GATGATACTG ACTGGGTTGA 
TGGTTGGTTC TAGAGACGAG AATGTTGGTT TGATTCTTTG CGATTTGGAA TTTACGCAAA 
GGACCCGAAC CACAGGATCT TCCAAGAATG ACTTTCATCT TCCACGCTCT CTGACTACGT 
TGGCGGATGT CGTCCCGGAT CGGCTTTGGC GACGTACCTT AGCCGACAAT ACAGTACACC 
GTGTAGCATA CTCATGTTCC TCACAATCCT ACTGTTTGCC GCTTTCTGCA CGACAACTTT 
AGAATCTATT CAAACACTTT CCACCAACGA GATAAACAGG ATGAGCTGCG ATATTGGTCT 
TTACGGTCTT GCTGTCATGG GACAGAATTT TGCGCTCAAT ATGGTACGTG TAGGGAGCAT 
TCGAGTTGAA TCAATCACCG ACGCACTGGT GGACTCCGTA CTGCGACCGA CCAAACCATG 
TCTCACGGAT TTTGCCTTGC TGTGTCGTTT TCTCTGTAGG CGTCGCACGG GTTCACCGTT 
GCCGTTTGCA ACCGCTCGCC CTCCAAAGTC GATACGACGG TCCAACGCGC CAAGGACGAA 
GGCGATTTGC CCTTGATCGG TACCAAATCT CCCGAAGAAT TTATTTCCAA ACTCAGCAAG 
CCTCGGAAAG TCGTCATTCT CGTCCAAGCC GGAAAACCTG TCGATTTGAC CATCGAAGCG 
ATCAGCGAAT TCATGGAAGA AGGGGATGTC ATTATTGACG GAGGCAACGA ATGGTTCCCG 
AATCAGATTC GTCGTCACGA AGAATTGGAA AAGAAGGGTA TCATGTTCAT CGGCATGGGA 
ATTTCTGGTG GCGAAGAAGG AGCCCGCAAC GGACCTTCTC TCATGCCTGG CGGTCCCCGA 
AAGGCGTACG ACTTGATTGA ACCCATCATC ATGAAGTGTG CCGCCAAGGC TGGGGATCCG 
GAAGAACCCT GCACGGGTTA TTGCGGACCA ATCGGAGCGG GCAATTACGT CAAAATGGTG 
CACAACGGTA TCGAATACGG CGACATGCAG TTGATTGGAG AGGTCTACGA TATTCTAAAG 
GTAGGCTATT CAACGGAGCG GAGCCTGTGC ACCTAAACCT TTGGAGCTTG TTCTCACCTA 
TCCTGTTGCA GAATATTGTC GGTATGGGCA ACGATGAAAT GGCCACACTC TTTGAAGACT 
GGAACTCTGG TGATCTCGAG TCGTACCTCA TTGAAATCAC GGCCAAGATT TTGGCTCGCA 
AGGACGATTT GACCGACGAC GGATACGTGG TGGACAAGAT TCTTGACAAG ACAGGAATGA 
AAGGTACTGG CCGTTGGACG GTACAAGAAG CTGCCGAACA GAGTGTTGCA GCCCCTCTCA 
TTGCAGCTTC CCTCGATAGT CGCTACATTT CCGGCCGCAA GGAAGAACGT GTCGCTGCCA 
GCAAAGTCCT CCAGGGACCA TCCAACGAAA TGCCGCAAGT CGACAAGGAT CAAATCTTGT 
CGGATCTGCA GCAAGCGTTG TACTGCGCCA AGGTAACTTC GTATGCGCAG GGAATGGGAA 
TCATCCAGGC CGCGTCCGAC AAGAACGAGT GGGACGTCGA CCTCTCCCTC TGTGCCAAAA 
TGTGGCGTGG AGGCTGCATC ATTCGCGCGA GCTTGTTGAG CAAGATCACG GCCGCCTTTG 
AAAAGAACAA GGACTTGCAG AATTTGTTGG TGGACGAAAC GTTTGCTGAA GAAATCAACG 
CAAGGCAGAT GGCTTGGCGC CGCGTGGTTT CTTTGGGCGT CGCTAGCGGT ATCGCTACCC 
CGGCCTTGTC CGCTGCTCTT TCCTACTTTG ACCAGTACCG TCGTGATCGC TTGCCGGCCA 
ACCTGATTCA AGCGCAGCGC GATTTCTTTG GCGGACACAC TTACAATCGT GTCGATCGTG 
ATGGCACTTT TCATTGCTTG TGGGACGAAA CGCACAAGGA TATTGGTGAT TTGACGGGCC 
GCACCGCGGG TGAGCTCTAG ACGCCACGGA TCCCGAGTCG CGTTAACGTA TATCAAATCT 
AAGTATTGGT AAATCACAAA CTTCGTCAGC AATAGCGAGT CATTTTAATA TC

Protein sequence

MFLTILLFAA FCTTTLESIQ TLSTNEINRM SCDIGLYGLA VMGQNFALNM ASHGFTVAVC 
NRSPSKVDTT VQRAKDEGDL PLIGTKSPEE FISKLSKPRK VVILVQAGKP VDLTIEAISE 
FMEEGDVIID GGNEWFPNQI RRHEELEKKG IMFIGMGISG GEEGARNGPS LMPGGPRKAY 
DLIEPIIMKC AAKAGDPEEP CTGYCGPIGA GNYVKMVHNG IEYGDMQLIG EVYDILKNIV 
GMGNDEMATL FEDWNSGDLE SYLIEITAKI LARKDDLTDD GYVVDKILDK TGMKGTGRWT 
VQEAAEQSVA APLIAASLDS RYISGRKEER VAASKVLQGP SNEMPQVDKD QILSDLQQAL 
YCAKVTSYAQ GMGIIQAASD KNEWDVDLSL CAKMWRGGCI IRASLLSKIT AAFEKNKDLQ 
NLLVDETFAE EINARQMAWR RVVSLGVASG IATPALSAAL SYFDQYRRDR LPANLIQAQR 
DFFGGHTYNR VDRDGTFHCL WDETHKDIGD LTGRTAGEL