Gene PHATRDRAFT_40626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40626
Symbol
ID	7198486
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011692
Strand	-
Start bp	488508
End bp	489601
Gene Length	1094 bp
Protein Length	292 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002184627
Protein GI	219128872
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0127959
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTACGTA GTCAGGGCAA CCCCAGAGCC TTTATTTAGT TGTACCGAGA TGAGAAAATG 
AAAAGAAGCC GAATGTACCG CAAGCAAGTT CGACTCAACT CATTCATTTT GCGATTTTGC 
AGTCTTCAAA TCGTTTTGCC ATCCTGGACG ATGACGATAC CGCTCCAGCC GTGAAGAAGG 
ATAGCAAGCC CGCCAAAGCT GCTGTCGAGG CTTCGAAGCC CGATGACCGG TATGTTGATT 
TCCTTTTCCC TGCTCAAAAC AATGGCATCT TTCAAAGTCA TATATGACGT CTAAAGATAA 
AATGTTCTCC CTCTTTTTGT GACAGTCGCC GTCCAAACCA AAATGACCGC AACACAAAGT 
TTGGCCGTGG TGGAAGAGCA CCGTCGCGTG ATGGGAAGAG AGCTTATGAT CGCCGCTCTG 
GGACGGGCCG CGGCAAAGAA ATCAAGAAAT CCGGTGGCGG TGCTAGAAAC TGGGGAACTG 
ACAAAGCAGA AGCAGAAGTT GTCTTCGTAG GTCAGGAAGA CAAGCCTGAA GAAATCAATA 
CAGAAGAGGT CGAGGAACCT GCTGAGCCTG AACCGGTGGA CAACTCGATG ACCTATGAAG 
AGTTTCTAGC TGCCAAGGCT GCCTCCTCAA GCGAACTACT CAAACCGACT AAGGAACGAG 
AAGTTGCAAA CGAGTTCACG AAAGTTGCAG CAAAGGTTTC TGAAGAAGAA GATTTTATGG 
TTATGGGAAG TGGCAAGGCG AGACGCAACA AGCAGCAGAA TAAGGCAGTG AAGACACTCA 
CCCCGGCTTT CCGTGTGGAA TCGGGCACCG TAGAGACGGA TGGGCATGGG GGACGAGGAC 
GCAATGGACG AGGAGAGGGA CGCGGAAGCA GAGGTGGGCG TCGTGAAGGA CGCGGCGGGC 
GAGGTGAAGG ACCTGGTAGG CGAGGTGAAG GACGTGGCGG GCGAGGTGAA GGACGTGGCG 
GGCGAGGTGA AGGACGTGAC GGACGGGGTG AAGGACGTAG CGGGCGAGGA CGTGGTCTAA 
GGGGGTCGGG TCGCGGTGGA GGAAGAGACC AGCAGGTCAA CGTCTTGGAC ACCTCGGCTT 
TTCCGTCTCT GTAG

Protein sequence

MSSNRFAILD DDDTAPAVKK DSKPAKAAVE ASKPDDRRRP NQNDRNTKFG RGGRAPSRDG 
KRAYDRRSGT GRGKEIKKSG GGARNWGTDK AEAEVVFVGQ EDKPEEINTE EVEEPAEPEP 
VDNSMTYEEF LAAKAASSSE LLKPTKEREV ANEFTKVAAK VSEEEDFMVM GSGKARRNKQ 
QNKAVKTLTP AFRVESGTVE TDGHGGRGRN GRGEGRGSRG GRREGRGGRG EGPGRRGEGR 
GGRGEGRGGR GEGRDGRGEG RSGRGRGLRG SGRGGGRDQQ VNVLDTSAFP SL