Gene PHATRDRAFT_52208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_52208
Symbol	ADH_1
ID	7202502
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011681
Strand	+
Start bp	337686
End bp	338747
Gene Length	1062 bp
Protein Length	353 aa
Translation table
GC content	51%
IMG OID
Product	alcohol dehydrogenase
Protein accession	XP_002181532
Protein GI	219122397
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGGCTG TTCGCTACCA CGGCGCAAAC GTTGCGTTGA CGGTCGAATC GATTCCCAGG 
CCCACAAACT TGGCCGACAA CGACGTCCTA ATCCAGGTTC AAGCAGCCGC GTTGTGCCAC 
ACCGAGCTGC ACTTTGCCGA CGGTACGCTA AATCTAGGGG TTGCTCCCAT GACACTAGGG 
CACGAAGCTT GTGGAATAGT AATCCAAGTT GGTAACAGCG TTCCCGATAC AAGAATTGGC 
GAACGTGTCA TTCTGTATTA CTACGTTGGT TGCGGATCCT GCCGATGGTG TCTGCAAGGT 
GACGAGCAAA TTTGTGGATC ACTGCAGGCC GAATTTGGCT TTATAAGCGA CGGTGGTCTA 
GCAGAATACA TCAAGGCGCC TTCTCGTAAC GCCGTGCCGC TACCTAGCAA TATTTCTTTC 
GTCGACGCCG CCCCCATTGG TTGTGGTGTA ACGACGGCGG TCCACGCGAG CAAAATAGGA 
AGGGTCCAGA AAGACGATTG GTGTTTGGTA TATGGCGTAA ATGGCGTTGG TTTCGGTCTC 
ATACAGCTTC TGAAAAATCA TTACGGTGCC AAAGTGATCG CTGCGACCCG TTCTCCAGCC 
AGACGGAAAC TGGCGCTCGA ACTGGGCGCC GACGTATCCA TTGATACTAC AGATTCCTCG 
ACTGTGGCCA AAGCAGTCCA CCAAGCAACA TATGGGGCTG GTGCAGATGT CATCTTTGAG 
TGCGTTGGAC GGCGTGAAAC AATGGATGCG TGCGTTGGCT GGGACGGTGC GTTAGGTAAA 
CGTGGTCGTT TGGTTTTAGT CGGATACGAG GCTGGAAGTG AGCACGAATT TCGATGCCAT 
CCGATTCCAA TGATTGTACA AGAGCAATCC GTTTGCGGTA GTGTTGGTGC TACTCTCAAT 
GATCTCAAGG AGGCACTTGA ATATGTTTCC TCTGGAAAGG TCAAAACCAT TGTGGACAGC 
CTCCTTTCCT TGCAGGATTT TCAGCGTGGC ATAGATAAAA TCAAATCATG CGACTGCATC 
GGAAAAATTG TTTGCCGACC CGCAGAAACC TCATTTGGCT AG

Protein sequence

MQAVRYHGAN VALTVESIPR PTNLADNDVL IQVQAAALCH TELHFADGTL NLGVAPMTLG 
HEACGIVIQV GNSVPDTRIG ERVILYYYVG CGSCRWCLQG DEQICGSLQA EFGFISDGGL 
AEYIKAPSRN AVPLPSNISF VDAAPIGCGV TTAVHASKIG RVQKDDWCLV YGVNGVGFGL 
IQLLKNHYGA KVIAATRSPA RRKLALELGA DVSIDTTDSS TVAKAVHQAT YGAGADVIFE 
CVGRRETMDA CVGWDGALGK RGRLVLVGYE AGSEHEFRCH PIPMIVQEQS VCGSVGATLN 
DLKEALEYVS SGKVKTIVDS LLSLQDFQRG IDKIKSCDCI GKIVCRPAET SFG