Gene PHATRDRAFT_53980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_53980
Symbol	GEL1
ID	7196403
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	-
Start bp	1101597
End bp	1103003
Gene Length	1407 bp
Protein Length	403 aa
Translation table
GC content	48%
IMG OID
Product	gelsolin
Protein accession	XP_002177218
Protein GI	219110933
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGTTC GTGAAAAATT GAACTGGAAA GATACCAATC TTGCTTTGTT CGGTTCAGAC 
CTTGAAAAGA AAATCAAGGC GGCGGCTGCA GATAGTGAAC CACAATGGAG CAACATTGGT 
ACATCGGTGG CGTTGCATAT TTGGCGTATC GAACAGTTTA TGGTCAAGCC TTGGCCAAGC 
AACAAACACG GAAAGGTATG AAAAATGCAG ACGTGACATT AGGAACACCT ATCAAGTTGC 
GAGACCTTAC AGTGTATAAC TTGGTCGTTT CCTTCCAAGT TTCACAAAGG AGATTCCTAC 
GTCGTCCTGA ACACATACAA GCCAGAGCCG AGCAAGCCAA AGCTTGCTCA TGATATTCAT 
ATCTGGATCG GAGACAACAG GTAAGAAGCT GTGTTTCCAA AGAAAACGCT CATTATGAGC 
TTTCTAAATT GTAGGAGAGT GAATACTGTC TATATGTTCG CTTACTGCGC GGTATACCAA 
TGCGTCGATA GCTCCCAAGA TGAATATGGA ACAGCAGCGT ACAAAATGGT GGAACTCGAT 
GACAAGCTTG GCGGTACTGC TGTCCAACAC CGCGAAGTTC AGGGCAAAGA ATCTACCCTG 
TTTCAAAAAT ATTTTGGGAA TCACTTAACC TATTTGGAAG GTGGCGTTGA GTCTGGCTTT 
CACCATGTGG AGTGCAGTGC AGCGGAACCT CATTTGTACA AGATCAAAGG AACTCGCAAG 
TCCGACACAC TGCGCCTAAC CCAAGAGCCT GTACGCCGCA ATTCTCTTAA CACTGGAGAT 
GTCTTCGTTT TGACGGCGGG GGAAGAGGCC GTCTGGATTT GGGTGGGCAA AGAATCGAAT 
CAGGACGAAC AAGCGAAAGG TGTGGAAGTG GCACAGGCCT TCTGCAAAAA AGGAAACGTG 
ATTGTCTTGA ATCAGGGCGT CAACGACAAT GAAAAAGAGG CCACCGAGTT CTGGGCCTTC 
TTACCGGGCA AAGTTGCAGT TTTAGGACCA ATCAAAAAGT CGGTTCGGGT ACAGGCTGCC 
GACGAGAAAG ACAATAAAAG CCGAGCTTTT GTACCGGTCC TTTTTCAGAT ACCGGAGCAA 
ACCGGTGGCA AGCTTCGCAA AGTGGCCACC GCCAAGAAGC AACCGGTCGG GCCAACCCGG 
GACATGCAAT ATTTGTTGCC GCGTTCAACG TTGCAGAGCA AGCACGGCTA TTTGCTAGAT 
ACAGGCTTTC ACATTTTCGT TTGGTTGGGC AGCCAGGCAC CTACTATCTG TAAGGCAAAT 
GCTATGCCTC AAGCGCACAT GTACTTTTCG TCTTTTCGAC GCCCCTTGTT GCCTTTGACG 
GTTGTCAAAG AACGACAGGA GACGGATTTG TTCCAGGAAC GATTTCACGA AGCTGGTAGC 
GCGGGTTGCG CTTGTGTTCT CATGTAG

Protein sequence

MNVREKLNWK DTNLALFGSD LEKKIKAAAA DSEPQWSNIG TSVALHIWRI EQFMVKPWPS 
NKHGKFHKGD SYVVLNTYKP EPSKPKLAHD IHIWIGDNSS QDEYGTAAYK MVELDDKLGG 
TAVQHREVQG KESTLFQKYF GNHLTYLEGG VESGFHHVEC SAAEPHLYKI KGTRKSDTLR 
LTQEPVRRNS LNTGDVFVLT AGEEAVWIWV GKESNQDEQA KGVEVAQAFC KKGNVIVLNQ 
GVNDNEKEAT EFWAFLPGKV AVLGPIKKSV RVQAADEKDN KSRAFVPVLF QIPEQTGGKL 
RKVATAKKQP VGPTRDMQYL LPRSTLQSKH GYLLDTGFHI FVWLGSQAPT ICKANAMPQA 
HMYFSSFRRP LLPLTVVKER QETDLFQERF HEAGSAGCAC VLM