Gene PHATRDRAFT_30019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_30019
Symbol
ID	7195250
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011688
Strand	+
Start bp	205931
End bp	207088
Gene Length	1158 bp
Protein Length	299 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002183570
Protein GI	219126661
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0257867
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TGGACTCCTG GACTCCTTGA ATTATTGACT CTGTTTTCTA CAGCGCAGAA GAAAGCAAGC 
AAGGCTCAGT ATTTCCATTA TTAGCGTCTG TCGCGTGTGG TCTGGCTTAC AATGAAGTTA 
GATCCTACTG TTTTGCGTAC CATGAGCAAA GAGGACTTTC GAGTTCTCGA AGCTGTAGAA 
AAGGGCATGA AAGATCATGC TTTGGTGCCA TTGCCACTTA CAACTTCCAT TGCCAATCTG 
CGACACGGAG GGGCCCACAA AATAGTTTCC AGTCTATTAC GTGATAAGCT ATTGAGTCAT 
GAGCGAACAA AGAACGGATA CGATGGATAC CGTGTTACGA ATGCTGGATA CGATATTTTG 
GCGCTCCAGA ATCTCAAAGC TAGGAAAATT GTCGCTGCTC TCGGTCAGCG GATCGGCACC 
GGAAAAGAAA GCGACGTCTA TCTTGCGGTC GATCTTTCGG GTCAACAAAT TGTGTTGAAA 
TTTCACCGAT TGGGTCGAAC GTCTTTTAGA AACGTCAAGA AGAAGCGGGA CTATTTTGGA 
AACGCTGCAC AACAAGCGCA TTCCTGGCTG TTTCTTAGCA CACTTTCGGC TTTGAAAGAG 
TTCGCTTTTA TGAAAGCACT TTACGATGTT CATTACTCTA CACCGGTACC GATTGCACAC 
AATCGACATA TTGTCGCCAT GGGCCTTGTC CGTGGCGTCC CTCTATATCA AGTTTTTCCA 
AAACAGCTTT CTGCGGAGCA GGCGGCCGAC ATTTATGAGC AGGCGATTGC TTTGGCGGCT 
CGGTTAGCTA AACACGGGCT CGTCCATTGT GACTTGAATG AATTTAACCT ACTGGTTGAT 
TTATCCGGTA TACAGTCACT CGCTACATCA GGTGATGATC CTTACATAAG ACACTCGGGT 
ATGTCTGTCG CTGGAGAAAA GTCGGTAGGT GCCCTTTCCA AGCCTGCGTG GGAACAGTCA 
CTGGAGGAGG GCGATAAGAT TGCTGAAGTT TTGCCAGAAC CGATCGCCCG TCTGGATAAT 
GGCGATCCGA AACCGGTTGT GACGTTAATT GACTTTCCTC AAATGATTTC TACGAAGCAT 
CCGAATGCTC AGGAGTTGTA TGAGCGAGAC TTGGCATGCC TGCGAAGATT TTTTGAACTG 
AAAATTCAGT GCACTATA

Protein sequence

MKLDPTVLRT MSKEDFRVLE AVEKGMKDHA LVPLPLTTSI ANLRHGGAHK IVSSLLRDKL 
LSHERTKNGY DGYRVTNAGY DILALQNLKA RKIVAALGQR IGTGKESDVY LAVDLSGQQI 
VLKFHRLGRT SFRNVKKKRD YFGNAAQQAH SWLFLSTLSA LKEFAFMKAL YDVHYSTPVP 
IAHNRHIVAM GLVRGVPLYQ VFPKQLSAEQ AADIYEQAIA LAARLAKHGL VHCDLNEFNL 
LVDLSEPIAR LDNGDPKPVV TLIDFPQMIS TKHPNAQELY ERDLACLRRF FELKIQCTI