Gene PHATRDRAFT_47694 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47694
Symbol
ID	7202702
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	+
Start bp	544795
End bp	545862
Gene Length	1068 bp
Protein Length	355 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002181931
Protein GI	219123229
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0222477
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTCAAC ACGTCGCTCG CTTTTCGCAA GCTGAACAAA ACAAAGACAC ACAGGGGACC 
GGAGGCGTCC GTCAGGAGGC GACTTCAATG GGTGAAGAAT GGGTCGACCG CGGCGTCGAA 
AGTGCCAAAG ATGTTGCCGG AAAAGCGAAG GAGAAAGCCG AGCCTGCCCA AAAGAAGGCC 
GAGTCCGCGA TGGAGACCAC AAAAGAACAA GGAGAGGCAG CGTATGAGAA GGCCAAGGAA 
CGCGGTGATG AGGCTTATTC GAAGGCGAAA GAAAAGGGCG AGTCATTAGC CGAAGCAGCT 
AAAGGAAAAG TAGAGCCAGC AAAAAACAAG GCTGAATCAG CGATGGAAAG TACAAAGGAA 
CATGGAAAGG AAGCATACGA TAAGGCTAAA GAACATGCTG AGAACATGAA AGCAAAGGCC 
AAAGAAACGG GTCAGTCGGT TGTCGAAACG GCAAACGACA CGGTCGACTC TGCACAAAGA 
AAGGCGAAGT CGGCTATGGA GACTACAAAA GAGCACGGGG AGGAAGCGTA CGAGAAGGCC 
AAGGACCGCG GTGGCGACGC TTACGAGAAG GCTAGGGAAT ATGGTGAGGA AGCATACATG 
AAGGCACAGG AAAAGGGTGA GCCAGTTATG GAGATGGCTC AGGAAAACGC CGAGTGGATG 
GCATCAAAGG CCAAGGAAAA GAGCCAAGAA GCCGTAGAAA AGGGAAAACC CTATGTAGCA 
CAAGCAGCCG AAACGGTCAA GGAGAAAGGT CATGAAGCAA TGGAAAAGGG CAAGCCTATG 
ATGGAGAATG CTACGAAACA GTTTCAACAA AAATCCAAAG AAGTTTACGA AAAGGGTAAG 
GAAAAGGCTG CTCCAATGAT GGAATCTGCC CAGGAAAAGA TACATGAAAA AGGTCAAGAA 
GCTGCTGCCA AGGCGAAGGA GCTGGGATAT GTAGCTGCCG ACAAGGCCAA AGACCTCGGG 
AAGGAGGCTG CCCAGAAGAC AAAGGAAGGT GCTTCGGTCC TTTTCGAAAA AGCCAAGGAA 
GCTGCAATCA GTGCAAAAGA CAAGATCAAG GATTCATTGT CCAGCTAA

Protein sequence

MVQHVARFSQ AEQNKDTQGT GGVRQEATSM GEEWVDRGVE SAKDVAGKAK EKAEPAQKKA 
ESAMETTKEQ GEAAYEKAKE RGDEAYSKAK EKGESLAEAA KGKVEPAKNK AESAMESTKE 
HGKEAYDKAK EHAENMKAKA KETGQSVVET ANDTVDSAQR KAKSAMETTK EHGEEAYEKA 
KDRGGDAYEK AREYGEEAYM KAQEKGEPVM EMAQENAEWM ASKAKEKSQE AVEKGKPYVA 
QAAETVKEKG HEAMEKGKPM MENATKQFQQ KSKEVYEKGK EKAAPMMESA QEKIHEKGQE 
AAAKAKELGY VAADKAKDLG KEAAQKTKEG ASVLFEKAKE AAISAKDKIK DSLSS