Gene PHATR_44147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATR_44147
Symbol
ID	7203897
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011671
Strand	+
Start bp	1120974
End bp	1122409
Gene Length	1436 bp
Protein Length	350 aa
Translation table
GC content	57%
IMG OID
Product	predicted protein
Protein accession	XP_002186186
Protein GI	219113205
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.156384
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GCACACACAC AAAATATAAT ACACACTATC CACTCCACAC ACAGGCAACC CATCAACACT 
CGTCCTACAA TACTTTCAAG GAAGCGATTC GTGTCCGTTT TCTCTCCATT CCCCGCATGC 
ATTCGAATCT AATACGCTGG GCATCCAGCT CTTCCGTGGG ACGTCGTCAC GTCGTTACCG 
TCGCATCCCG CTCGTGGTGG GTCCGGTGTT TTTCCACCAC TTCGTCGGGC CCGGGGCGCG 
GTGGATACCG CCGCCCCCGT CCCAAAGCGA TGCACTCCTC CGCCGCCCAT CCCCACTCCG 
TTGCGGCGGT AGCTACCGCA CCCTCGACGT CGACCGTCTG GAACCACCAA CCCGCGAAAG 
ACGCCGTGCC GCGGCCTTCC GTCGAGGCTC TCAAAACCAT ATTCACAGCC TCGGCCATTC 
CCATGGTAGG GTTTGGCTTT ATGGACAATT TTGTAAGTGC CTTGGTGTCG TTTGACGTGT 
ATGGACAGGT GTCCGTGTAT ACGTGCGGGG CGTGTTCGTA GCGTGTCGTG CAGCACCAAC 
AGTCCCTCAC CGTGTGGTTG TCTTTGGTAT TGCATTGTTT TGCTGTGGAC GACAGGTTAT 
GATTCAAGCC GGACAGTACA TTGACAGTAC ACTTGGTGTG CAGTTGGGTC TCGCCACCAT 
GACGGCGGCT GCTGCGGGAC AAGTCGTCTC GGACGTCAGT GGCGTAGTGT TCGGAGGAAC 
GTTGGAGCGC TTTCTACAGC GGTTGGGTTT GATACGATCG CCCTGTCTTA CATCAGCCCA 
ACGCCAGTTG CCGATCACTC GGAACGTCAC CATGGCCGGC GCCGTGCTCG GGGTCATTGT 
CGGTTGCGCA CTCGGAGCCT GTACCTTGTG CTTTGTGGAT TTGGAAGCCC GTGATCGCAT 
ACATCACGCC ACACAGTTGC GGGATTTGGT CACCGACCTG GTCGCCGGTG GGAGTGCCGA 
CGAAGCCGCG CTCGTCTGTG AACGCGCAAC CGTGCACGTC AAGCAGACGG GCTCCTACGA 
TCTCGCGCAC ATGAAGATGG AACCGAACGC CCTCACCAGT CTCGTGCTTT TGGAAGACGG 
GTCCAACGGT AGTGCGGCGG CCAGGGATTG TGCCGCGCAA CGAGAGGTCA TTGTCGACGA 
GAACGGCAAG GCTCTTTACG CACCCGTCGT CAAACTGAAC GGTGACGTCA TGGCGGTAGT 
GGAACTGCGG AAAAGCGATC AGATGGAAGC CTTCCGTCCG GCCGATCTGC ATACGGCCAA 
GGTCATGGGA CGCCACATTG CCATTTTCAT GGACCGGATC ATTGAATCCT AAAAAAACGG 
CACTGCCAAG TTTTGAGGGT ACACGACACA CCGTAGTCGT AAGGTGGCAA CTGGACGAAA 
CAGTCCACCA ATTGTTACCC GATTTTAACT GTATACAGAG AATTCTGCTC CTTTTG

Protein sequence

MHSNLIRWAS SSSVGRRHVV TVASRSWWVR CFSTTSSGPG RGGYRRPRPK AMHSSAAHPH 
SVAAVATAPS TSTVWNHQPA KDAVPRPSVE ALKTIFTASA IPMVGFGFMD NFVMIQAGQY 
IDSTLGVQLG LATMTAAAAG QVVSDVSGVV FGGTLERFLQ RLGLIRSPCL TSAQRQLPIT 
RNVTMAGAVL GVIVGCALGA CTLCFVDLEA RDRIHHATQL RDLVTDLVAG GSADEAALVC 
ERATVHVKQT GSYDLAHMKM EPNALTSLVL LEDGSNGSAA ARDCAAQREV IVDENGKALY 
APVVKLNGDV MAVVELRKSD QMEAFRPADL HTAKVMGRHI AIFMDRIIES