Gene PHATRDRAFT_12121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_12121
Symbol
ID	7200640
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011675
Strand	-
Start bp	617227
End bp	619032
Gene Length	1806 bp
Protein Length	601 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002179879
Protein GI	219118199
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GGCAAGTGGG CACGGAAATG GGCAATTCTA CGCAGATCCG CTGAAATTTG GGCGTATTTC 
AGTTCATTCT ACATTAAAGA TCGTCGCATT TCAGCGAAAT ATAACAGTGG CGCCTGGTCG 
GAAGAGAAGT TCAAAGCGGA GCGATCGCAG CTCGGTAAAG AAATTACACA GAACCTTCTC 
AAGCTCGGTC CAACCTTTAT CAAAGTTGGT CAGCTATTCT CTACTCGCAT TGATATTGTA 
CCAAAAGAGT ACATTGAAGA ACTCAAACAA CTTCAGGATA ACGTTCCGGC CTTCTCTGGA 
GATTTGGCAG TACGGATCAT CGAGGAGGAA CTTGGCAAGC CAATAGACCA ACTCTTTGAT 
GAATTTGATC GAAAATCTCT TGCAGCTGCA TCGCTTGGCC AAGTACACAT TGCTCGTAAG 
GGTGACGAGA TGCTAGCCAT CAAGGTGCAA AGGCAATACC TCCGAGAATT GTTTGAAGTG 
GATTTGGGCC AGCTTCGCCA GGTTGCTGTT TTTGCTGATG CCTTGGATCT CACATCGGAA 
GGGGGTCTTT TGGATCGAAA TACACAACGC GACTGGGTCA GTGTGTTTCA AGAGAATCAA 
CGCTTGCTTT ATGAAGAGAT TGACTACATT AACGAAATGA ACAACTGCAA CAGATTTCGT 
GAGAACTTCA ATACTGCAAA ATTCAGACAT ATACGGGCTC CAAAAACATA CCCTGAGTTC 
ACCACAGACA AAGTTATGGC GATGGAATTT TTACCTGGTA TCAAGGTAAC AGACAAAGAG 
AAAATTGAGC AGGCTGGCTT AGACCCAATT GATATCAGCG TGAAGATGGC AGAGGGTTTC 
CTCGAACAGC TGTGCCGACA TGGATTTTTT CATTCCGACC CTCATCCTGG GAACGTTGCA 
GTAGAAAAAG GTCCGGACGG GGAGGCAGTA ATAATATTCT ACGATTTTGG CATGATGGAC 
AGTTTCGGTG ACGTGCAGAG AAAAGGCCTC GTTGACTTTT TCTTTGCGGT CTACTACGAC 
GCAAATGTCA AAGATGCGAT GGATGCGCTC GAACGACTCG GAATGCTAAG AAATGGTCCT 
GATATCGACC GAGTTGCTGT TGAGCGTGTC GGTAAGGATT TTATCGATCG GTTTCAGGAA 
ACACTTAAAC GAGACGCATC GTGGGAGAAC GAGCTTTCGG AAGAGGAGCG GAAAAGAATC 
ACTCGGGAAC GACGAAGGAA ATTGGGCGAA GAATTTCTCT CTTTGAATCG TGATAGTCCG 
TTTGTCTTCC CGCCCACGTG GACGTTCGTC TTCCGTGCTT TCTTTTCGAT TGATGGAATT 
GGGAAGACGC TTAACCCACA ATATGATCTT ACGAAGCTAA CGCTACCGTA CTTGAAAGAG 
CTCCTTGACT TAAAAGATGG TAACGCTTTC AAAACAACAT TGATTCGGAT AGGCAAGCGC 
TTAGGTCTCC GACCTGAAGA TATCAATCAA GCAGTTACAC AGCCACGCCG AACAGCAAGA 
GTGGAGGACG TGGTCACGCG CATGGAGCAG GGAGACTTCA AGTTACGCGT ACGAGCGCTA 
GAAGTTGAGC GGGAACTGGA GCGCAGCAAA CTTGTGCAGA AAAACACCTT TCAGGCAATT 
CTTTCTGGGT TACTTTTCCA AGGAGCCGTT TCCTTGGCAA CTGTAGGTAG TGGTCTTTAC 
GCTGCAGGTC CGATCAGCCG TACTCTTTTT GCCGTGTCCG CGGTACTCGG TATCCAAATA 
CCTTTCGGTA TTTTCCGGTT GCGAAAACTT GACAAGTACA ACGCTGGGTA CGGCTTGAAT 
AAATAG

Protein sequence

GKWARKWAIL RRSAEIWAYF SSFYIKDRRI SAKYNSGAWS EEKFKAERSQ LGKEITQNLL 
KLGPTFIKVG QLFSTRIDIV PKEYIEELKQ LQDNVPAFSG DLAVRIIEEE LGKPIDQLFD 
EFDRKSLAAA SLGQVHIARK GDEMLAIKVQ RQYLRELFEV DLGQLRQVAV FADALDLTSE 
GGLLDRNTQR DWVSVFQENQ RLLYEEIDYI NEMNNCNRFR ENFNTAKFRH IRAPKTYPEF 
TTDKVMAMEF LPGIKVTDKE KIEQAGLDPI DISVKMAEGF LEQLCRHGFF HSDPHPGNVA 
VEKGPDGEAV IIFYDFGMMD SFGDVQRKGL VDFFFAVYYD ANVKDAMDAL ERLGMLRNGP 
DIDRVAVERV GKDFIDRFQE TLKRDASWEN ELSEEERKRI TRERRRKLGE EFLSLNRDSP 
FVFPPTWTFV FRAFFSIDGI GKTLNPQYDL TKLTLPYLKE LLDLKDGNAF KTTLIRIGKR 
LGLRPEDINQ AVTQPRRTAR VEDVVTRMEQ GDFKLRVRAL EVERELERSK LVQKNTFQAI 
LSGLLFQGAV SLATVGSGLY AAGPISRTLF AVSAVLGIQI PFGIFRLRKL DKYNAGYGLN 
K