Gene PHATRDRAFT_13578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_13578
Symbol
ID	7202155
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011680
Strand	-
Start bp	325123
End bp	326247
Gene Length	1125 bp
Protein Length	345 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002181354
Protein GI	219122023
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGATC CAACTGGAAT TGCCTTCACG CCGGCTCTAC ACGTTGACGA AATTGGTCTA 
ACATCCGAAA AGTATATTCC GATCAATGAA ACCTTGACGA GCTTGCCTTT GCGCATTTCT 
TTCGATCGCA GCGACATGCA TCATCAGGCA ACAACGAGCT CGACGGCAAC GGCAGGTGGA 
TTGAGCCCAG CACGTTGGCG CTTGCTAATG CACCTTTCGC AAGCGATTGA ACAGCAGACG 
CAGTTGGGTT TTGAGCAGTC CGATATTGAC GATGTTCGGC GACTTATTGC GGAGACAAAC 
GTGACCCTTT TGGCAATAAC GATGCTAGCG AGTGCCCTAC ATTTGTTGTT CGAGTTTTTG 
ACATTTAAGA GCGAGGTCAA CTTCTGGAGC AAAAATGAAG ATTTGACAGG TTTGAGTGTT 
CGTTCCTTAT TCCTTGATAT GATCGGACAA ACGGTGATAC TTTTCTTTCT AATCGACAAA 
GACAGTTCAC TTCTAATGAC AATTCCAAGT GCCTGTGGAT GCCTTATTGC ATTGTGGAAA 
TGCCAGCGAG CGGCCGGTCT TCGTTTCGTC CGCACAACAC CCGACCGCAA TATTGCGTGG 
TGGAACTGGT TGCCGAGTAT GGTTGGCTTT GAACTCCGTG CGACTCGGTT AGAATCGCAA 
CTAGCGTCTA TGGCCAGGAA AGAGAAGGAA CATTCGGCGG CGGCACGCAA GCAGGACCTC 
ACAGCTTTGA CAATTGAGTC TGACCGAATC GCTACACGGA CGCTTGGAAC GGTTCTCTTA 
CCATTCGTCG TCGGATACAC CCTTTATTCG CTCGTCTTTG AGGAACACTT AGGCTGGTAC 
TCCTGGCTGA TCACGTCGGC TTCATCGGCT GTGTACGCCT TGGGCTTCGT GCTGATGACG 
CCGCAACTTT TTCTGAATTG GAAACTTAAG AGCGTTGCTC ACCTGCCTTG GCGTGTGCTG 
GTCTACAAAT CATTGAATAC TTTCATCGAC GATCTCTTTT CCTTCATTAT ACGAATGCCG 
ACTATGGCAA GAATTAGCTG CTTTCGAGAC GACGTTGTCT TTTTTATCTA CCTTTACCAA 
CGTTGGCTTT ATCCTGTCGA CGCATCTCGG CCAGCGGAAG GTGGT

Protein sequence

MDDPTGIAFT PALHVDEIGL TSEKYIPINE TLTSLPLRIS FDRSDMHHQA TTSSTATAGG 
LSPARWRLLM HLSQAIEQQT QLGFEQSDID DVRRLIAETN VTLLAITMLA SALHLLFEFL 
TFKSEVNFWS KNEDLTGLSV RSLFLDMIGQ TVILFFLIDK DSSLLMTIPS ACGCLIALWK 
CQRAAGLQSQ LASMARKEKE HSAAARKQDL TALTIESDRI ATRTLGTVLL PFVVGYTLYS 
LVFEEHLGWY SWLITSASSA VYALGFVLMT PQLFLNWKLK SVAHLPWRVL VYKSLNTFID 
DLFSFIIRMP TMARISCFRD DVVFFIYLYQ RWLYPVDASR PAEGG