Gene PHATRDRAFT_40645 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40645
Symbol
ID	7198569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011693
Strand	-
Start bp	53207
End bp	54367
Gene Length	1161 bp
Protein Length	386 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002184723
Protein GI	219129075
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTTTGT TCTTGTCGTT AGCGGGAGCC TCATCATCAG TCCATATATC CAAAGCCCTT 
CTTGTTCTAA TAGTCATCCA GTGGATTGTG TTTGCAAAAC TAAGCAAGAG ACCCACGAGC 
GCAACCCTTA TCGAGCGAAG GCACGGTGCA TCTGGCGTTC AAACCACAGT TTTTGAACCA 
GCGAAAGTAC AAGCAAAAGT TACGCAGGTC GACAACGAGT GCAAAAGTTT TGCACCTATT 
TCCGAAGTTA TGAACCAAGA AAGCGAGCCA GAGATTGATG GTGTAGCCTT TATGATTCTG 
AAAAAGAGAC CATATTGGTT TTTCAAGCGC TACAACGCGC TGCTCGACAG TGCTCTTGCG 
ACAGTCCCGA ACACCTGGGC CATTCAGCTT TTTGTCAATC AAGACTGGTT CGAAAACACG 
CTATTGCCTA ATCAATACGG CGTCCGGCGT CACGTGCTAG ATAATCCACG AGTGATTGTC 
AAGGACTTGC CGCTTAGATT GCAAAACAAT AAACCGGGTC CAATCACAGA AGATCGCTGG 
ATATGGGACA ATATCGTCAA TGCCACAACT GCCACAACCG AGACGACGGA CTACTTCCCT 
GTTGTTCATT TTCACGGGGG CGGAAGTTTT TGTGCAAATT CCAAAATGTC CTATGCGGAT 
CTCCGGAATG CTCGAATTGA CTTCATTGGA CCACCTTCGA CAACTTTTGG TGGGATGGGT 
GGACTGGGAG GAGGCTACTT CTACCAAAAT CGCTATGCCG CACTGGCAGT CTACGATTAT 
TCGAAGCGCA GTCACCTCTC ATCTGACGAT CATATACGGA TAATGTTGGA CATGACTCGA 
AAAGGTATCG CTAACTTTAC GATAGCAACA CCGGAACAGA CGTTTGCCTT TGGTGGAACA 
AGTAACCTCG ATTCAGCAGA GGGCCGTCTA TTGACTAACT TGACTGACTG GGGGCCTATG 
GTCGTTGAGG GCGTCCAATA CGACATTTCC CGAGAGGCCC GTGAGCACAT TTGGAAAGTA 
TGCCCTGAAA GTAAGAATTT TTATCCGGGC GTGACACGCA CGGCATGTGT CGGGGACCAT 
GTGGATCCGA TTTCCTGTGC CAGAGCATAC AACATCTTGC CCGTCAACTG CAGTAGTGGG 
AGCGAAGCGA GCTTGCCTTG A

Protein sequence

MSLFLSLAGA SSSVHISKAL LVLIVIQWIV FAKLSKRPTS ATLIERRHGA SGVQTTVFEP 
AKVQAKVTQV DNECKSFAPI SEVMNQESEP EIDGVAFMIL KKRPYWFFKR YNALLDSALA 
TVPNTWAIQL FVNQDWFENT LLPNQYGVRR HVLDNPRVIV KDLPLRLQNN KPGPITEDRW 
IWDNIVNATT ATTETTDYFP VVHFHGGGSF CANSKMSYAD LRNARIDFIG PPSTTFGGMG 
GLGGGYFYQN RYAALAVYDY SKRSHLSSDD HIRIMLDMTR KGIANFTIAT PEQTFAFGGT 
SNLDSAEGRL LTNLTDWGPM VVEGVQYDIS REAREHIWKV CPESKNFYPG VTRTACVGDH 
VDPISCARAY NILPVNCSSG SEASLP