Gene PHATRDRAFT_21922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_21922
Symbol
ID	7203044
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011683
Strand	-
Start bp	83087
End bp	84429
Gene Length	1343 bp
Protein Length	306 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002182319
Protein GI	219124036
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTTTTCTCGG CGGTACTGTA TTCGGCGTCT AGTGCCATTA TTCATTACCC TACATGTCTT 
CCCTATATGC AGTCTCGATG CCTTTCTGGT CCCGGACGTA AGACTCAGAA GGACTCAGGG 
TCTGAATCAA CGCCAATCTT ATATACGCGC CGAGAAGGAA AAGAAATTGA CGGCGGACAC 
GGATCTATTG AAATCCCTCG ATGATTCTTT TTCCTACGAC GGCCGCCTGG AAGGATCTTC 
CTTTGCAGAC TTTCGCTGTG GCTTTGTCAC GGTTATGGGG GCGCCGAATA TGGGCAAGTC 
AACGCTGCTG AACGCACTTC TGGAAGAGGA CCTGTGCATT GCGACGGCCC GTCCCCAAAC 
GACTCGTCAC GCTATTTTGG GTCTCATGTC TACCGATAAA TGCCAGGTCT GTTTAGTTGA 
CACGCCCGGG GTGATTGAAG ACCCCGCCTA CGAGCTGCAG GAAGGTATGA TGGAAGCCGT 
TACAGGTGCT GTGGCGACTT CTGACGTTCT TTTGGTCGTT ACGGACGTCT TTTCTACACC 
TATACCCGAT GACGAATTGT TTCTCAAAGT TCAGAGAACA CGAAAACCGG TACTAGTAGC 
GATCAATAAA ATCGACTTGG CAAAAAAAGT AAACAAAGCA GCGGAGGAGA ATCGAGACAA 
GACGGTGACG GTCGAAGAAG CCGTAGCGTT CTGGCGAGCC CAGTTGCCGA ATGCCCTCTG 
CATTCTTCCG CTATCGGCTT CGCAAGGAAT CAACAATGTT GGTGTGGTGG CGATGAGAAG 
GATTCTCACG GGTGGCCCGG ACGTGCCGTC GGTGATCCGA GCAATGGGGA GGCCCATTCC 
AGGAATGTTT CTGGGGGACA CCCAATTCGT AACGGACGAC GCGTGTCGAG AACTCTTACC 
GATTAGTCCC CCGCTGTACG ATCCGGAAAC ACTAACGGAT CGGCCGGAAC GCTTCATTGC 
GTCGGAAATT GTTCGGTCCG CTCTCTTCCA GGTACTGAAG AAAGAGTTGC CGTACTGCTG 
CGAGGTGAGA ATTCGAGAGT TCAAGGAACC AAAAGAGGAG GGTGAAGTAA TACGGATTGC 
GGCGGACGTT CTAGTAGAAC GCGACTCTCA AAAGGTAATT GTTATTGGTA AGAATGGCGC 
TCAGGTGAAA GAGATTGGCG TGATCGCGCG GGAGAAGCTG GAAGCCTTTT TTCGGCACCA 
AATTTTTTTG AACTTGTCGG TGAAAGTCGA CAAAGACTGG CGAAAGAATA CTCGCAAGCT 
TACTGAGTAT GGATACATGA AACCCAAAAG GTAAAATTGG GGGATAATGC CAAAGACTCA 
ACTAGCAACA ATTTTCTGTT CCG

Protein sequence

MGAPNMGKST LLNALLEEDL CIATARPQTT RHAILGLMST DKCQVCLVDT PGVIEDPAYE 
LQEGMMEAVT GAVATSDVLL VVTDVFSTPI PDDELFLKVQ RTRKPVLVAI NKIDLAKKVN 
KAAEENRDKT VTVEEAVAFW RAQLPNALCI LPLSASQGIN NVGVVAMRRI LTELLPISPP 
LYDPETLTDR PERFIASEIV RSALFQVLKK ELPYCCEVRI REFKEPKEEG EVIRIAADVL 
VERDSQKVIV IGKNGAQVKE IGVIAREKLE AFFRHQIFLN LSVKVDKDWR KNTRKLTEYG 
YMKPKR