Gene PHATRDRAFT_54834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_54834
Symbol
ID	7203248
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011683
Strand	-
Start bp	768938
End bp	770298
Gene Length	1361 bp
Protein Length	392 aa
Translation table
GC content	52%
IMG OID
Product	dehydrogenase
Protein accession	XP_002182453
Protein GI	219124316
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.286619
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCCTTTC GGTCTACCCA AAACGATCGA TCCCGGACAA TCAGGATGAA TGCGACCAAG 
AATCTGTTAC GTTCTCGTGT CGGAAAATAC TCGCGTGCAT TGGTACGACC AGTAGCAAAG 
CTTACGGGAA ACGCGTTCCC GTTGCGTGCC GACTTTCGTG GAACGAGTCA GTCCACAGTC 
GTTCCGCATC ATCGATTCTT TGGCACCGAC GCGCACGTTA ATGTCGTTCA CGTTTCGGTC 
CAAGAAGCCC GAGAAACAAC CGCCAAGGCG CTGCAAATGA TTGGCTGGGA TCACGAAGAT 
GCAGCTCTCC AGGCAGAAAT TATGACGGCC GCCGAATTGT GTGGCAACAA TCAGGGACTC 
GTCAAAATGT ACCAACCCGC ACTCATGGCG CCGTCGCCCA ACGCCGGGAA ACCAACTGTC 
GAACGCGAGA CTCCCACATC GGCTGTCGTT AACGCAAATC AATCACCCGG GATGCTCGCT 
GCCGTCAATG CTGCCGACTT GGCGGTCCAC AAAGCAACAA CCAACGGTCC TATTGCCATC 
GTTACCTCCT ACAATACCTC TACTTCGTCG GGACAGCTGG CCTTTTATGT AGAACGCATG 
GCACGAAAAG GAATTATTGG GATTGCTATG GCCAATTCAC CAGAGTTCGT GGCGGCGGCT 
CAAGGAGGAA AGCCCGTCTT TGGGACCAAT CCCATCGCCG TGGGAATTCC ACAAAAAGAC 
GCGGTTCCCT TTACGGTACG GTAATATTGA CTGTGAACAC TGTACCGGAA AGCGACCCTA 
CTTTCACGTC TTGACACACC GTTTTCTCAT CTATTCTTTC CTTTCGTTAC CATAGTTTGA 
CATGGCGACT TCGGCAATTG CCTTGTTTGG GTTACTGACT TCCAAAGCGC AGAACACGCC 
GCTGCCATCC AATGTTGCCT ATGGTAAAGA CGGTGGTTGG ACCACTGATG CCGCAGAAGT 
GTTGGACGGC GGTGCAATTG CAACCTTCGG TGGACACAAA GGTGCAGGGC TGGCCTTGTG 
TATTGAGCTA TTGGCTGGGG CTCTCTCGGG AAGCGCAGTA CTTGGACTTG TGGAATCCAA 
AAAGTCGGCC AAGTCATGGG GACATTTGTT TATTGCTATC GATCCCAATG CTTTGACGGA 
CGATTTTGAA AGCAAGACAG CCTCTGTTAT CGCCGCGGTG AAAGCGTCCG GTGACAACAT 
TCGTATCCCG GGAGAGCGGT CCGCAAACAT GTCGGAGGAA CGAAAAGCTG TGGGAATCAT 
GCCCGTACCA CAGAAGATTT GGGAATCCAT TGTCTTGACT GCTGAGCACG GCATCCAAAA 
CTAGACAATA ATTTGAAAGG TAAAGAAAGA CTTTCGCGTC T

Protein sequence

MNATKNLLRS RVGKYSRALV RPVAKLTGNA FPLRADFRGT SQSTVVPHHR FFGTDAHVNV 
VHVSVQEARE TTAKALQMIG WDHEDAALQA EIMTAAELCG NNQGLVKMYQ PALMAPSPNA 
GKPTVERETP TSAVVNANQS PGMLAAVNAA DLAVHKATTN GPIAIVTSYN TSTSSGQLAF 
YVERMARKGI IGIAMANSPE FVAAAQGGKP VFGTNPIAVG IPQKDAVPFT FDMATSAIAL 
FGLLTSKAQN TPLPSNVAYG KDGGWTTDAA EVLDGGAIAT FGGHKGAGLA LCIELLAGAL 
SGSAVLGLVE SKKSAKSWGH LFIAIDPNAL TDDFESKTAS VIAAVKASGD NIRIPGERSA 
NMSEERKAVG IMPVPQKIWE SIVLTAEHGI QN