Gene PHATRDRAFT_49229 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49229
Symbol	FTHFS
ID	7195695
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011689
Strand	-
Start bp	296045
End bp	298201
Gene Length	2157 bp
Protein Length	666 aa
Translation table
GC content	58%
IMG OID
Product	fomate-tetrahydrofolate ligase
Protein accession	XP_002183964
Protein GI	219127483
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.167975
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTCAT CACCGGCGTC GTCCACGGAC GTTGCCTCGA CCAACGCGTT GGGGTATCCC 
AAGCTGCAGC CTCAACATCC CGTACCGACC GACATTCAAG TCAGTCAACA AATTGTCCAG 
CAAGTTGGAC TCTTGCCTCT CTCCGACCTC GCCCAACAGT AAGTTGTCGG TTGTTATTTA 
TGGACGGTAT CTACCGATGG ACGGAGAAGT AGACGTACTT TTACTTGTAC TCATAGTTGC 
ACGCGTGTGA AACCTGCACT TCCTATGCAA TGCTCACTCT CACACTGACA CTCACACAAT 
CACTCCCACA CTAGACTCGG CTTGACTCCG GACGAGATCA TTCCGTGGGG CATTGCCAAG 
GCCAAGATCC CCTTGTCGGT CCGGGACACG CGTCGGGCTG TCCCCAACGG CAACTACGTT 
GTCGTTACGG GGATTAACCC GACACCGCTT GGCGAAGGCA AGTCCACCAC CACCATTGGA 
CTCGCGCAGG CCTTGGGTGC CGTGCGGGGA CGTCCCACCG TGGCCTGTAT CCGACAGCCC 
TCGCAGGGAC CCACCTTTGG TATCAAGGGC GGCGCCGCCG GAGGCGGGTA CGCACAAGTC 
GTACCCATGG AAGAATTCAA TCTACACTTG ACGGGAGATA TACACGCCGT CACGGCCGCC 
AATAATCTAC TCGCCGCCGC GATTGATACA CGAATCTTTC ACGAAGACGC ACAGTCCGAT 
CAAGCTCTCT TTCGCAGACT CTGTCCACCC AACAAACCAT TCTCGCCCGT TATGCAACGC 
CGACTCCGCA AGCTCGGTAT CGACCCTCAC AAGGCACCGG CCGATTTGAC CCCCGCGGAG 
CAGTCCAAAT TTGCCCGACT CGATATCGAT CCCGATACCA TTACCTGGCA ACGCGTACTC 
GATACCTGTG ATCGACATTT GCGTGTCGTA CAAGTCGGAA TCGGTCCCAA CGAGAAAGTC 
ACCCCGCGTA GCGACGATCC CGGACAACCC GCCAAACCGC GAGTCCAACA CGATCGCGTC 
ACGGGCTTTG ATATTACCGT CGCCTCCGAA GTCATGGCCG TCCTCGCCTT GGCCCGTAGT 
TTGCCGGATT TGCGCGACAA GCTCGGTGCC ATGGTGGTCG CCTACAGTCG GGCCGGCGAG 
CCCGTCACGG CGGACGATTT GGGTTGTGGT GGCGCCCTCG CGGTCCTCAT GAAGGACGCC 
ATTTTACCGA CGCTCATGCA AACTGTCGAA CGTACACCCG TCTTGGTCCA CGCCGGTCCT 
TTCGCGAACA TTGCGACGGG AAACTCCTCC GTCGTGGCCG ACGAAATGGC GCTCAAAATG 
GTCGGACCCG ACGGATACTG CGTCACGGAA GCCGGATTCG GCGCCGACAT TGGCATGGAA 
AAGTTTTTCA ACATCAAATG CCGAGCCAGC GGACTGAAAC CCAAATGCGC CGTGATTGTC 
GCCACGGTGC GGGCGCTAAA AATGCATGGC GGTGGCCCAC CCGTGTCGGC CGGCAAACCT 
TTGCAGCCAG AGTACGTACA GGAAAATGTT GAACTCGTCC GCCGCGGCGC GGCTAATCTG 
GCCCGGCACG TGGAAAACGC CAAAAAATTC GGTGTTAACG TGGTGGTGGC CGTGAACCAG 
TTCCAAACCG ATACTCCCGC GGAGATTGAA GCCGTCCGGC AAGCCGCGCT GGAAGCGGGC 
GCCTACGATG CCGTTCTGGC CAATCATTGG GCCGAAGGAG GACAAGGCGC CGCGGACCTC 
GCAATCGCCG TCGAAAAAGC CTGTGCGGAC AATGACGAAG CCAATTTTCG ATTCCTCTAC 
GACGTCAACT TGTCCATTGA AGAAAAGGTC AACGTTATTG CCAAGGAAAT CTACCGCGCC 
GACGGTGTCG ACTTTTCCAA CACGGCCCGG GCGCAGATGG AAAAGTACGA GGCATCGGGC 
TTTGGCAATT TGCCCATTTG TATCGCCAAG ACGCAGTATA GTTTTAGTTG CGATCCGTCC 
GCCAAGGGCG CTCCTACCGG ATTTCGCGTT CCGGTCCGCG AAATCCGTAG CTGCGTCGGC 
GCCGGATTTC TCTACCCCAT TTGCGGCGAC ATTATGACTA TTCCAGGACT CCCAACCCGG 
CCCGGATTTT ACGACGTGGA CATTGATGAA AATGGTGGCG TTGTGGGACT GTTCTAA

Protein sequence

MSSSPASSTD VASTNALGYP KLQPQHPVPT DIQVSQQIVQ QVGLLPLSDL AQQLGLTPDE 
IIPWGIAKAK IPLSVRDTRR AVPNGNYVVV TGINPTPLGE GKSTTTIGLA QALGAVRGRP 
TVACIRQPSQ GPTFGIKGGA AGGGYAQVVP MEEFNLHLTG DIHAVTAANN LLAAAIDTRI 
FHEDAQSDQA LFRRLCPPNK PFSPVMQRRL RKLGIDPHKA PADLTPAEQS KFARLDIDPD 
TITWQRVLDT CDRHLRVVQV GIGPNEKVTP RSDDPGQPAK PRVQHDRVTG FDITVASEVM 
AVLALARSLP DLRDKLGAMV VAYSRAGEPV TADDLGCGGA LAVLMKDAIL PTLMQTVERT 
PVLVHAGPFA NIATGNSSVV ADEMALKMVG PDGYCVTEAG FGADIGMEKF FNIKCRASGL 
KPKCAVIVAT VRALKMHGGG PPVSAGKPLQ PEYVQENVEL VRRGAANLAR HVENAKKFGV 
NVVVAVNQFQ TDTPAEIEAV RQAALEAGAY DAVLANHWAE GGQGAADLAI AVEKACADND 
EANFRFLYDV NLSIEEKVNV IAKEIYRADG VDFSNTARAQ MEKYEASGFG NLPICIAKTQ 
YSFSCDPSAK GAPTGFRVPV REIRSCVGAG FLYPICGDIM TIPGLPTRPG FYDVDIDENG 
GVVGLF