Gene PHATRDRAFT_40171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40171
Symbol
ID	7195937
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011690
Strand	-
Start bp	312699
End bp	313866
Gene Length	1168 bp
Protein Length	364 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002184227
Protein GI	219128032
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.280697
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAGAAAG GGGTTCCAAT GCACCGAGTT CCCCAGCCCC AACATCAGCG ATGCCGAGTT 
AAGCTACAGT GCCTGGTACT CGGTGCAGCT GGTGCCGGAA AGACGTCCCT CTTGAGGCGA 
TATTTTCACA ATGCCTTTCA GGCTGGAACT CGTGTGCCTA CGCTAGGCTC CGACTTCTAT 
ACGGGACGCG TGCCGAATCC TTTGCAGGAG CATAATTCGT CGTCTACGGA TTCACATGTT 
CTCATCAATC TTCAAATGTG GGTAAGTCAT TGGGCCCACG GGCAGGCTCG TAGGCATCGT 
ATTTAAAAAG GAACGCAGCT GCTTTTGGCT GAAGACGGGC GTAAACTCAG AGTTCTTTTT 
CTTTCAGGAT ACGCCTGGTC GGGAACGATT CTATTCGAAA CGTCAAAGGC GACACACCGA 
CGCAGCTTCA TTGGGGGCAT CGTTCTTCCG GCAAGCTGAT GCAGTAATGT TGGTCTACGA 
CATGACATCT TCAACATCGT TTACACAACT TTTGAAATGG TATGCCGATC TGGTGGACCT 
TTGTCAAAGC AAGCCTGTTC CAATTTTGAT TGTGGCGAAT AAACTGGACC TCTTCATTGC 
TGACCAGCAA CGCGCTTCGA CGTGGGTCCA TCCCCGTAGA GTTTCGCAAC GAGACGTCCT 
GGGACTCGCT GGGTCCTTTC GAGGCAATGA CTTTCGGTAC GAGTATCGTG TTTCTACGCA 
GTTATCCCCC AATCCGATGA AGAAGAAACA TCAACGGAAA CAAAGCCACC GCAGAATGGA 
GATCTCCAGC TTTCTTGCCA ATCGTGAAAA CTGGACAACC GACGGATCCT ATTTAGAATC 
CTTGCTTAAT TCGGAAGACG CTTCGCACCC GGATCGTGAA ATGGTTTTGC TTTGGTGCAT 
GCGAAACGGT TTGAAACACG TTGAGGTCAG TGCCGCTACT GGCGAGCATG TCGATGGAGC 
GATCGATGAG CTCATCCGTC TCGCCTTGCT CACCAAACAA AGCAAAAATT GCGACACGAA 
AGCAGACCTA GTGGGCATTG AAAGCCAACC TTTATATCAA CGAAACGATG AGTTGAACGT 
TCAAGAAAGG TATCAGTCTA ATGAGGATCG ATGTACGTTT CTACGACCCG TGATAGACCT 
TTTTCAGCAA AGGAAAAATA TGATATAA

Protein sequence

MQKGVPMHRV PQPQHQRCRV KLQCLVLGAA GAGKTSLLRR YFHNAFQAGT RVPTLGSDFY 
TGRVPNPLQE HNSSSTDSHV LINLQMWERS CFWLKTGVNS EFFFFQDTPG RERFYSKRQR 
RHTDAASLGA SFFRQADAVM LVYDMTSSTS FTQLLKWYAD LVDLCQSKPV PILIVANKLD 
LFIADQQRAS TWVHPRRVSQ RDVLGLAGSF RGNDFRYEYR VSTQLSPNPM KKKHQRKQSH 
RRMEISSFLA NRENWTTDGS YLESLLNSED ASHPDREMVL LWCMRNGLKH VEVSAATGEH 
VDGAIDELIR LALLTKQSKN CDTKADLVGI ESQPLYQRND ELNVQERYQS NEDRYLFQQR 
KNMI