Gene PHATRDRAFT_50367 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_50367
Symbol
ID	7199189
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011697
Strand	-
Start bp	95115
End bp	96449
Gene Length	1335 bp
Protein Length	230 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002185327
Protein GI	219130344
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTTCATCATT AAGTTGTTCT ATTTTATAAG TAAAATTCAA TGTAAAGCAT GTAAACAAAG 
GCATCTACCG TAGAGGACCT CCTTCTGGTT TTCTATTTTA CTCTGGTTTT CCATGCAAGC 
ATGAGGAGTG TTGCGATTGC GGGGACGCCA AAGCCTGGAA CACTGCTGGT TGCAAACAAC 
ACCGTCCTCC ACCAGCGCTA CTTTCCGAAA ACGCCACGCA TTACCCAGGC AATCCTTTTG 
AAGCCATCCA CGCCAGCCGC CGCAGATGCA CACTGCCACC TTGGCCGTTG TGGTCGGAGC 
CGCCGTACAC AGCCTTTTCA ATACCGTCAA GTGCGCCGGG ATTGGCACCA ATCCTGTACA 
GTGGAGACAA CAATGGGCCG TTGAGGTGGT CAAAATTGCC AATGGCATCG TGCATCCCAA 
AGATTACGCC CGCATCCAAC CCAAGGAGCG TCGCGGCAAT GACGACAACA GCAACCCCAC 
AATATTGACC CGCCCGTTTC TCTGTCCACC TTCTGGGTGG AGGTCACCAC CACCCCTGCC 
TTCCCAACCG GATTTCATTT GCAACTACAA CTCCACAATG ATAACGTATC CTCAAGAAGC 
ACAGGCGTCG ACCCAACACC GCCACATGCC AAACAACCCC TCCTGCAGCG GTTGGGTGCC 
ATGGCAAGCA TGACTACAGA TGGTGCGGAC AACACAATGA ATTGTGCGGA CTGGTGGAAA 
AAGCGTGCAG AACACGTTGA CGGCATTGGT GTACGCGTTT GATACCGCTT CGCAGAAACA 
GCAAGAGGCG GACCGGATCA CGTCAAGTCT CTTTCTGCTT TGCTTGCCTG GCTTGCAACT 
GGTCAGCGGC GTCGGCACGA TTTGTCTGGA TCAACTCGAG GCACGTCAGT ATGATTTTGA 
ACATACGGCT TCCGGGATGG ATGATGCGGA AGAAGATTTC GTCCATCAGC CGTCGAACGA 
TAGCTTGTTG CCGGCCTTGA CGTACGTGGC GGGAGACCAT CCTCTCATGA CATCCTTACT 
AGCGGCTCCG GACGACTGCT TTTGGATTCC CGGTCGACCC GTCACAAGCG GCTGCCGCAT 
ATGCTGTGCA ATTTAGATTA CGTTATTGAG ACACTCGGTA CTGCGATTCG ACTTCTCTTA 
CCACGACGCT TTCTGGTATA TCACGGGCCA CGTATGGAGC CCACACACAT TGTGATTCAC 
TTGTGCCAAG TACTGACTGC ATCAAACCAA CAGCTACTGA TGCCAATGCA TGAGGAATAT 
ACTCTACACA ATCATAGACA AATATAAAGG AAAAAATGCT AAATGGTTGT GTTACTTAAG 
AGGTACTTCG CGCTC

Protein sequence

MHTATLAVVV GAAVHSLFNT VKCAGIGTNP VQWRQQWAVE VVKIANGIVH PKDYARIQPK 
ERRGNDDNSN PTILTRPFLC PPSGWRSPPP LPSQPDFICN YNSTMITVQN TLTALVYAFD 
TASQKQQEAD RITSSLFLLC LPGLQLVSGV GTICLDQLEA RQYDFEHTAS GMDDAEEDFV 
HQPSNDSLLP ALTYVAGDHP LMTSLLAAPD DCFWIPGRPV TSGCRICCAI