Gene PHATRDRAFT_37956 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_37956
Symbol
ID	7202694
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	-
Start bp	509184
End bp	510332
Gene Length	1149 bp
Protein Length	382 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002182079
Protein GI	219123537
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.834363
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATCACGA GGAGAGGAGA GATGTTGCTT GGTCTCAATT GGATTTTACT GCTTTACCCA 
ACAACGGAGT TCCAGGTTGC ACATTCTCGT TGTATTGGAC GTTTGTTTTC GACGGTCCAC 
GATGATGATA CCAATCACAA TCAATTGAGT AACAACGATC AAGATAGACC CCTTCCGTGG 
ATGAACTGTG GCGTGCTCAT TTCATCTTTT AGTGACGGTG TGATGCCAAA TGAAGATGCA 
CAGATATTTT TGCAGCGCGG ACTAGTAAAT GCTCTTTTAC TGGAAGAACG GCATCGACTG 
GAACATGCAG TTAAAGCCTC GGCGATCCAA AGTCCATGTT GCGGACCCGA TGTTACGGTA 
TTGGACCGTT TGCAAGATGT TGACAGACGT ATAGAGCAAG TCGAGAAGTA CGCCACTCCT 
CTCGATCTCT TGAATGCGCA CGAGCCGGTC TCCATTCGCC TCCTTTATAT TCCTACCGCT 
ATGTATGCTA TACGATCAAA TTCTGAGAAT ACGCCTGGCA AACAACGGCA ACGCGCTCGG 
GCAGACGGAA AGAAGCGAAG GACGCGCATA GTGGATGTTT TGAAAGAGCT AATTCCGACT 
GAAAATACAA CGATCTTGGC AGCGACTCTC GATTTCGACG ACGGCTCGGT CAAACAAACG 
GAAGGAGCGG CTAGTCAAGC GGTGTTTCCA CAAAGCGGGA AAGACGCAAT GCGTGATTGG 
GAACCTCATA TTATATATGT GGAAGGAGGG AACACCTTCT GGCTTTATCA TTGTATTGAA 
AAAGGACACT GGAACGAAGA TCTGGTGAGA TATTGTACCG GCCCGCGACA AGGCGTATAT 
TGTGGCTCTA GTGCTGGTGC TATAGTAGCG GGGGCGTCCA TTGAAACGGC TTGCTGGAAA 
GGATTGGACG ATCCAACTGT CGTTCCGGGT AGGAATGGTT ACAAAGATTG GAAAAACGTT 
ACGGGTTTGC GCTTAGTCGG CGCTACTTCG ATCTTTCCAC ACATGGAAGA CCGGTGGGCA 
GATACCGTAC GGGAAAAACA AGAAAAGCTG CGCGAACCAG TTCTTTGTTT ACGCGACGAT 
GAGGCGCTTT GTGTGTCTGG CCATAAGCAA TTGGCATACG TTACAAAGGG AGCGCAAATA 
GCAAGCTGA

Protein sequence

MITRRGEMLL GLNWILLLYP TTEFQVAHSR CIGRLFSTVH DDDTNHNQLS NNDQDRPLPW 
MNCGVLISSF SDGVMPNEDA QIFLQRGLVN ALLLEERHRL EHAVKASAIQ SPCCGPDVTV 
LDRLQDVDRR IEQVEKYATP LDLLNAHEPV SIRLLYIPTA MYAIRSNSEN TPGKQRQRAR 
ADGKKRRTRI VDVLKELIPT ENTTILAATL DFDDGSVKQT EGAASQAVFP QSGKDAMRDW 
EPHIIYVEGG NTFWLYHCIE KGHWNEDLVR YCTGPRQGVY CGSSAGAIVA GASIETACWK 
GLDDPTVVPG RNGYKDWKNV TGLRLVGATS IFPHMEDRWA DTVREKQEKL REPVLCLRDD 
EALCVSGHKQ LAYVTKGAQI AS