Gene PHATR_10544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATR_10544
Symbol
ID	7204274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011671
Strand	-
Start bp	204927
End bp	206417
Gene Length	1491 bp
Protein Length	496 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002186299
Protein GI	219113431
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0977616
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTAGCGCTGC ACGCTCTACA GCACGTACTG CAATCACGCG CTACAATTTA TCAACACAAT 
CAACGTATTC AGGCTTTGGA AGACCAAGAA GACGAGCAAC AAAAAGTCTC TGACAATGAT 
AACGATGAGG AAGAAGAATC GTGGCGTGAT CAAGGATTTA CCCGACCAAC GGTGTTGATT 
CTCCTACCTA CCCGAAGTAC GTGTCATGAT TTTGTCAAGA CACTCCTGTC TCTACTACAG 
CAGGATCAGC CTCAGCAGCC GAATTCCAGG GATGACGATG CTCGAGACCG GTTTGATCAA 
GAATATGGTC CCTTGCAAGT GGACGATGCC GACATGGACG AGAATGCCCG TGTATATCGC 
CAGAAGGCTA TTCAAAGTAA GGGCTCGGAT TGGCACGAAT TATTTGGAGA GACTGCAAAC 
GATGACGACG ACTTCAAACT CGGGTTATCC CTTCACCCCA AACGCAGAAA CAAAAAGAGC 
GTCACGGAAT CTACGTGTGA TATCAAGCTC TATTCCGATT TCTACAAGAG CGATATTATC 
GTGGCATCGC CGCTAGGACT GAAAATATCT GTCACACCGG AGTCGATTTC GGAAACTTCA 
GACAACGACG CAGATTTCCT TTCCAGCATC GAGATGTGCA TTGTGCACCG CTCCGACGTG 
CTGTTGATGC AAAATTGGGA TCATGTGATG GATTTGCTGC CATTGCTGAA CCAGCAGCCA 
AAAAAGACCA ACGATACGGA TTTCTCGCGC GTACGACCGT ACCTTCTAGC CGGACAGGCT 
GCACAATGGC GACAACTCAT CATGACAAGC CAATTTTTGG ATCCCTTGAT TTTGTCTACA 
TTCAAGCGTT TCTCCGAGAA TCGACAGGGT CAAGTCCGTA TTCGCCGCAA GACACCCGCG 
GAAGAAGCCA ATGTCACCAG TGTACTGTTG CCCGTTCGTC AAGTTTTTCA GCGTGTGTCC 
TGCAGCACCA TAGCGAATCA AGGAGCCGAT CGTGTACGCT ATTTTGTCGA CAGCGTACTC 
CCTCAGATTC AAAGGCACAA GCAGCATCAC ACCATGATTT TCATTCCGTC TTATTTTGAC 
TTTATATCGC TCCGCAACAT CTTGTTGAAG AAGGAAGTTG AATTCGTATC CGTGACCGAG 
TACGCCCGGA CTAGCGAAGT GAGCCGGGGT CGGGCTCGTT TCCTGCAGGG CCGCAAACCG 
ATCATGCTGT ACACGGGTCG AGCACATTAC TTTTTGCGGC ACCAGATCAA GGGAATCCGA 
CACCTAATTT TTCTAGGTGT ACCGGAAGAG GCATCTTTCT ACGCGGACCA CGTGAATCTT 
CTCAATGAAG GGTTGGAGAA GAGGGACGAT ATAATTATGG ATGACGGATT GGCAAGTTGT 
TTGGTGTTGT ACACCAAGTA TGACTCGTAC GCTTTGGAAC GGATAGTTGG AACGGCCAAC 
TGTAGTCGTA TGGTAAGGGG AGAAAAGTCG AGCTTTATCT TCGCCTCGTA A

Protein sequence

LALHALQHVL QSRATIYQHN QRIQALEDQE DEQQKVSDND NDEEEESWRD QGFTRPTVLI 
LLPTRSTCHD FVKTLLSLLQ QDQPQQPNSR DDDARDRFDQ EYGPLQVDDA DMDENARVYR 
QKAIQSKGSD WHELFGETAN DDDDFKLGLS LHPKRRNKKS VTESTCDIKL YSDFYKSDII 
VASPLGLKIS VTPESISETS DNDADFLSSI EMCIVHRSDV LLMQNWDHVM DLLPLLNQQP 
KKTNDTDFSR VRPYLLAGQA AQWRQLIMTS QFLDPLILST FKRFSENRQG QVRIRRKTPA 
EEANVTSVLL PVRQVFQRVS CSTIANQGAD RVRYFVDSVL PQIQRHKQHH TMIFIPSYFD 
FISLRNILLK KEVEFVSVTE YARTSEVSRG RARFLQGRKP IMLYTGRAHY FLRHQIKGIR 
HLIFLGVPEE ASFYADHVNL LNEGLEKRDD IIMDDGLASC LVLYTKYDSY ALERIVGTAN 
CSRMVRGEKS SFIFAS