Gene PHATRDRAFT_33730 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_33730
Symbol
ID	7198020
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	-
Start bp	227877
End bp	229279
Gene Length	1403 bp
Protein Length	402 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002178455
Protein GI	219115319
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.00194424
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACACAA CTTTCCAAAT TTCAAGCCTT GGAATGGGTT TTCGTGTTGA TAATTCCATT 
GGGCCTACTA AATCTTTCCC TATCCGTTGT GACAAGACTG ATATTCTCCC AATCCGTTGT 
GACAAGATTG ATAGTACCAA AGAACCTATC ACGGTTACAT ACAGAGCTTT AACGTCCTAC 
GAACGTTCTA GCCTTCCCGT TTACATTTCA AACAAGTCAT CGCCATATGA AACAGTCATT 
GGCGATTCAG CTGCATCATA CAAACTCAAT CACGATTCTC AAACTAGTCA TAAATCTTAT 
TAGTTCATCG ATTTCCATCA TTCGCGTTCT TGCGTTTGTA GAGCTCATCT ATATTTCGGT 
CGCATCGAAA AAACATTTTG TGAGACAGTA AACCTTGAAA CGACACCTTT ACTCTAGCTA 
ACTGACAGCG AAACTCATCG CAATCGTCGC TCGCTGTCAG CTTCGACGAG AAAATCGAAA 
GAGTCGCGTA TGATATTTCG ACTCTACCAG GAAAAAGAAA CAGCCCGAAC ACAGACACAG 
CTATGGGCGT CAGTCACGAC CAACAGATTC AACCGGAAGA AACCGAGGCT ATTCTATTGG 
AGCGCATGCA AGAGATGCAG GTGGAACTGA GGCTACTGTC TCCCTATGAT CGAGATTGCC 
TTGACTTGGC CATGCGCAAA TGCCCCGCTC TCGCCAGCGA CCGATCGTTT CAAGTTTCGT 
TTTTGCGGAC GGAAGTGCTG GACGCCAAAC GTGCCGCGAA ACGGTACGCT ACATACTGGA 
AGCATCGAGT GAACCTGTTT GGTCCGGTCC ATGCCTTTTT GCCATTGGTA ATCAAAGATG 
AAGCAGACGT GATGGAGGCG ACGGAACAGG CACCGAACAG CGCCTTGACA ACCGAAGACA 
TGCACGTTTT GAAGTACGGT TTTACTCGTG TCGTGGCTGG CCATGGACGT GTGCTGCTCA 
TTGACCCTTC TCGGACGGGA CCAAAAAGTG ACTACAAAGT CGATAGTATT GTGCGTTGTC 
TCTTCTATAC CGCCACTAAG GCCCTCCTAG CAGATGAAGA AATGCAACGC AAAGGCGGGA 
TATTCATTCT CGATATGAAA GGCAGTATCC GAGGCTTCGA TCGAGCGTTG ATTAAACGCT 
TGACGGAAAC AACCAACGAC GGCTTCCCTT TGCGCTGCTC CGCCTGTTGC ATTTTACGTC 
CACCGCTACT GGTGGACACA TTTGTCAAAA TAGCCAAGGT CTTCTTGCGA TCCCGTGTCC 
GCAATCGCAT TCACGTGGTC ACATCGGAGT CCAAATTGGA AAAGCACGTC GGTGTGTACT 
CTATGGAAGC GCTGTTTGAA GCAGCAGACC ACAAAGCTTG GCTGAATCAA ATGCGTACTG 
AGGATTTTAA GCAATATAGG TAG

Protein sequence

MNTTFQISSL GMGFRVDNSI GPTKSFPIRC DKTDILPIRC DKIDSTKEPI TVTYRALTSY 
ERSSLPVYIS NKSSPYETRN SSQSSLAVSF DEKIERVAYD ISTLPGKRNS PNTDTAMGVS 
HDQQIQPEET EAILLERMQE MQVELRLLSP YDRDCLDLAM RKCPALASDR SFQVSFLRTE 
VLDAKRAAKR YATYWKHRVN LFGPVHAFLP LVIKDEADVM EATEQAPNSA LTTEDMHVLK 
YGFTRVVAGH GRVLLIDPSR TGPKSDYKVD SIVRCLFYTA TKALLADEEM QRKGGIFILD 
MKGSIRGFDR ALIKRLTETT NDGFPLRCSA CCILRPPLLV DTFVKIAKVF LRSRVRNRIH 
VVTSESKLEK HVGVYSMEAL FEAADHKAWL NQMRTEDFKQ YR