Gene PHATRDRAFT_44844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_44844
Symbol
ID	7199560
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011673
Strand	-
Start bp	416664
End bp	417978
Gene Length	1315 bp
Protein Length	424 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002178996
Protein GI	219116402
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCTCA GCAAGAAATC ATTGTCGGCT CCCTGCTGCG TCCAAAAACT CTTTCTTCCT 
CCCACGTCAA TACTCGGATT CAGATAACAA CCATTACTTT TCATCTAGAA AGCTTCCACA 
TTGTATACGA CACCGTCAGT GGAAATTGCG CGCTTCGCAG AGTCCATATT CAGCTTCCTC 
GGAAGTATCG TCAGACGCCT TAGAACAAGC CCTCGGTGAG GAAGAGGAAG TACTTTTGTC 
AGAAGAAGAT TTTTCAAGTT TGCCGATAGG AATTCCGAAG GGTTTCTTTG TAGTAAAGCA 
ATACACGTTC TCTGCCGAGA AGGACTTCGA TTGGAGCCAA CTAGGGATAG ATCCGAAAGA 
TGCGGAAAGG CTTGATCTCT CGCCACGAAA CGTGTCCTTA CCAATAGCAC TTATGATGGC 
CGATCCTATT GACTTTCCTT CTTTTTCTCG TGCACGTAAA GCTTGTCGTA AAGGTAATGT 
TTTGATTCAT CGAGGAGCTC TAAAGATGGA CGAAAAGACT CCAGAGTCAA CAATATTTGA 
TCCATTAATG TGTGTCCGAG GCCGCGTGGG TGATCGGTTG TACCCAGGGG ACACCGTCGG 
AAAGCAAGTT CGAATCGGCA GCGGGTATTT TCCTGTTTTG AACTATAAAA AGCCACCCTT 
TGAGCTTCCA GTCATAATCG AAGATGACCA TTGGGCATTA GTGAACAAGC CCGCCGGCAT 
CGTTGTTTAC AATCAAAGAA ATGGAGGACA CGGTATTATG ACCGTAAGGG CTGCGCTTCC 
CTTTGTTCTC GCACCGCCGA AAGTAGGTAC CATTTCAGTG TTACGGCGAC CCGCATCGGT 
TCATCGACTA GACAAACCTA CGAGTGGTAT ACTTTGCATT GCCAAAACGA AACCCGCCAT 
GCTGTGTCTT TCGCGGCAGT TTCATGACCG TATAGTGAAG AAAACGTATT TTGCGGTCAT 
AAACGGTATT CCAACCTATT CGAACGAATC GAAGATTTCT TCGAAGACCG CGTACGAACT 
CGGAGTGGAT GTGGACCCCA ATGATCTTGA TGATTGGCAG CTAATCGACT CCCCTCTCGA 
CGAAAAGAAG GCGGTTACTG TATGGAGGGT GGTCCGATCA ATCAAGTCGC TACATGCCAA 
CGACGGATAT CTTACACTGG TCGAGTTGAA ACCTAAAACA GGGCGCTATC ATCAGCTGCG 
ACGGCACATG GCGTGGGTTT GTCAGCGGCC TCTGGTAGGT GACGATGAAT ACGACGGAGG 
GACCGAGTCT GCCATGAGGT TTCGCGATCG TGGTCTCTTC CTGTGTTCGA CCCGT

Protein sequence

MALSKKSLSA PCCVQKLFLP PTKLPHCIRH RQWKLRASQS PYSASSEVSS DALEQALGEE 
EEVLLSEEDF SSLPIGIPKG FFVVKQYTFS AEKDFDWSQL GIDPKDAERL DLSPRNVSLP 
IALMMADPID FPSFSRARKA CRKGNVLIHR GALKMDEKTP ESTIFDPLMC VRGRVGDRLY 
PGDTVGKQVR IGSGYFPVLN YKKPPFELPV IIEDDHWALV NKPAGIVVYN QRNGGHGIMT 
VRAALPFVLA PPKVGTISVL RRPASVHRLD KPTSGILCIA KTKPAMLCLS RQFHDRIVKK 
TYFAVINGIP TYSNESKISS KTAYELGVDV DPNDLDDWQL IDSPLDEKKA VTVWRVVRSI 
KSLHANDGYL TLVELKPKTG RYHQLRRHMA WVCQRPLVGD DEYDGGTESA MRFRDRGLFL 
CSTR