Gene PHATRDRAFT_48667 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48667
Symbol
ID	7194905
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011686
Strand	+
Start bp	530340
End bp	531750
Gene Length	1411 bp
Protein Length	373 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002183117
Protein GI	219125710
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.236073
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTCTGTACCA CATCTGCAGC CTTCTCCCAA CACTCAATTT CACCGAATAT GACGATGGGT 
GCCCAAATAT TAAACCAAGT CAGCAGCGAC GAAGAAGAAG ACTGTAGTTA CGTCAAGCAG 
CGACGCTCCA AAGTGGCCAA GTCGCGATCC TCGAAGGGCT TCCCCGTGTC ATACGGCGGC 
TACAAGGACT ACGCCAAGCT CTCTACCGAC CAGGCGAAGC AGATCATCCA ATCTCCCAAA 
AGTAAACGCC GTGGACCGCG GGGCGGTGTT GCGTTGCCCT TCCCCGTCAA ACTGTCAGTC 
ATGCTTGACC ATGTAAAAGC CGCAGGATTG GACGACGTTA TTTCTTGGGC CAGTCATGGC 
CGCTGTTTTA GCATTCACAA CCCAGACCGA TTCGTTGACG ACGTATTACC AAGGTATGTT 
TTTCTATGTG GTCGCTTGCG TGAAACCTTC AAGACTAGAA GCCTCACGCA ATGATCGTCC 
GCTTTACTAA AAACAGATAT GACTTTCGCC AAAGCAAGCT TACTTCGTTT CAACGTCAGT 
TGAACTTGTA CGGTTTCATG CGTCTATCTG CGGGTCCCGA TCGTGGCGCG TACTACCATG 
AATTCCTCCT GCGAGGACGA CCTGAAATGA GCAAGTTCAT GCTTCGAGTC CGAGTCAAGA 
CCAACGGTAT CCGACATTCG ACACCCTCTC CGAATAGTAA CGAGCCGAAT TTTTATCAAA 
TGCCGCCTTG TGATGAGCCT GAAGTTGGAC CTCGTACACA CGACGAAAAA GATTTTCCCC 
CAATGGTAGA GACAAAATTT CCTCACACGC ATTGTGGAAG TGACAAAGAA GTGAAGCAAG 
CCATCGAATT GCTGGAACCT CACCACATTT TTCCACCTTA TCCGGTAAAA AGTACGAATA 
CAATTCATGC AAGTACGACA CATTCGCCGT CCACAACGCA AGGATGTCCC GTTGAGTCAG 
TCCGCCATTG TCTTTCCGAT CAGTCTTTGC TGTTATTGGT ATCTCCTTTG GCTTGCCCCC 
CAGTTCTCGT GAATTCAATG GCTACTACGC AAAATTCTGC TAATTTTTCT CAAAGATACC 
TCAAACCGAT AAAGGATACC AAAACAACAA GCGAATCGCC CAAGATTTGT TTCTTTGAAG 
GCCTACAATT CACTCCTGTG GATTTGGAAT CTCCACTATC CAACCAAGAA GCCTACAGCG 
AATTGTGGGA AATGGATGCT TTTGACGACA CTCCGATTGA AGTTATTTGG TAATCTTTTG 
ATCGGTTTTC TGTTTTGCAA CGTGCAGAAT AGGGCACCCT CCGCCATTTT GACATTGTCT 
ACTTTATTTT ACGCCGACTG CACGATCGCT CGCCTGCCCG CCCGCCAGAA ATTTTACTAT 
ATGCAATTAC ATAAAACGTG TACATTGTTC C

Protein sequence

MTMGAQILNQ VSSDEEEDCS YVKQRRSKVA KSRSSKGFPV SYGGYKDYAK LSTDQAKQII 
QSPKSKRRGP RGGVALPFPV KLSVMLDHVK AAGLDDVISW ASHGRCFSIH NPDRFVDDVL 
PRYDFRQSKL TSFQRQLNLY GFMRLSAGPD RGAYYHEFLL RGRPEMSKFM LRVRVKTNGI 
RHSTPSPNSN EPNFYQMPPC DEPEVGPRTH DEKDFPPMVE TKFPHTHCGS DKEVKQAIEL 
LEPHHIFPPY PVKSTNTIHA STTHSPSTTQ GCPVESVRHC LSDQSLLLLV SPLACPPVLV 
NSMATTQNSA NFSQRYLKPI KDTKTTSESP KICFFEGLQF TPVDLESPLS NQEAYSELWE 
MDAFDDTPIE VIW