Gene PHATRDRAFT_1990 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_1990
Symbol
ID	7197003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	+
Start bp	1238676
End bp	1239845
Gene Length	1170 bp
Protein Length	390 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002177787
Protein GI	219112071
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGTCTAAAGG TCATCCAGGC AGACACATCT TCGCACCTTT CATCCGTCAA GACCTTTCAG 
GAATTAAATC TACCTACTCA CTTGTTGGAA GCTCTCTTTA CGATGGGTTT TGATCGTCCT 
TCCGCTATTC AGGAAGAAGC CCTGCCTCGG ATTCTTGCGG ATCCTCCGCG GAACTTGATC 
GGTCAAGCCA AATCTGGTAG CGGCAAGACC GCAGCCTTTA CACTAGGCAT GTTGTATCGA 
ATCACTGTTG ACACTCCTGC TACGACGCAA GCTTTATGTG TAACACCGAC ACGTGAACTG 
GCAATTCAGA TCGTGGACAA AGCTGTCCGT CCCATGGCCG TCAACATGAA AGGCCTGAAG 
ATACAACTGG CGATTTCGCA ATCAGTAGTG GACAAAAAGA TTGGAGTTGA CTCACATATG 
GTAGTCGGTA CACCAGGAAA AGTGGTGGAC TGGCTGAAGC GACGAATTAT AAACCCTGAT 
ACCATCAATA TCTTTGTACT TGATGAAGCT GACAATATGG TGGAGGAGGG AGGCCATCGT 
GCCAATTCTC TTCTTATAAA GAAATGTATT CCCCCTACTT GCCAGAATCT CTTCTTTTCG 
GCGACTTTTC CGGAGGAAGT TGTCAATTTT GCAACCAAGA TGGTCGATAA TCCTGATAAG 
ATATTGATTG AAGACGGACC TGAATTCCTT GTGCTGGACG TTATAAAACA GCTCTGGGTA 
GACACCAGAG AATATTCGGG TGGAAAGCTC ATGTTTCTGG GAGACATTTA TTCGCTCCTG 
ACCATTGGAC AGAGTATTAT TTTTGTTGGA ACCAAGATAG ATGCGGATAC AGTGCATACT 
ACATTGACGG GCGCTGGTTT CACGTGTTCT GTTTTGCACG GATCCGTGGA TGCCGCGCAG 
CGTGACACAA CAATGGAGGC TTTTCGAAAC GGTGAAAGCA ATGTACTTAT AACAACAAAC 
GTCCTTGCCC GAGGAGTGGA TGTCGACAAC GTTTGCATGG TGATCAATTA CGACATACCA 
GTTGACAAAG ATGGTGCCCC CGACTTCGAA ACATACTTGC ACCGCATCGG GCGTACCGGA 
CGCTTTGGAC GCAAAGGTAC AGCCATAAAT CTCATTTCCG ACCAAAAGTC AGTTGAAATT 
CTGGCTGCTA TCGAGTCGCA TTTCGCCAAA

Protein sequence

RLKVIQADTS SHLSSVKTFQ ELNLPTHLLE ALFTMGFDRP SAIQEEALPR ILADPPRNLI 
GQAKSGSGKT AAFTLGMLYR ITVDTPATTQ ALCVTPTREL AIQIVDKAVR PMAVNMKGLK 
IQLAISQSVV DKKIGVDSHM VVGTPGKVVD WLKRRIINPD TINIFVLDEA DNMVEEGGHR 
ANSLLIKKCI PPTCQNLFFS ATFPEEVVNF ATKMVDNPDK ILIEDGPEFL VLDVIKQLWV 
DTREYSGGKL MFLGDIYSLL TIGQSIIFVG TKIDADTVHT TLTGAGFTCS VLHGSVDAAQ 
RDTTMEAFRN GESNVLITTN VLARGVDVDN VCMVINYDIP VDKDGAPDFE TYLHRIGRTG 
RFGRKGTAIN LISDQKSVEI LAAIESHFAK