Gene PHATRDRAFT_18274 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_18274
Symbol
ID	7197487
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	-
Start bp	989242
End bp	990327
Gene Length	1086 bp
Protein Length	173 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002178047
Protein GI	219112591
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCAGA ATCCGGTCGT GTTCTTTGAT GTTACCATAG GCGGATCGGC AAAGGTGTGT 
TTTCAGAGCC GTTTCCTTGG ATAGTAGTAA TGTCTGCCGA AAGCCATGGA GGAGGGCAGC 
TCGCCGGTCG GCACCATGTG ATGTCTCTTC TCTGACCGTG TACAAAAATA ACAACCAGGG 
TCGGATAGAA ATGGAGCTCA GAGCAGATGT TGTCCCCAAG ACGGCTGAAA ATTTTAGGTG 
CCTCTGTACG GGCGAGAAGG GTATCGGAAA ATTGGGGAAG CCTCTGCATT TTAAGGGATC 
AGCTTTTCAT CGTGTGGTAC GTACGAGCTA ATGCGGGAAT CTGTGTTCAC AAGAAATCCT 
ACCTTTTGGA CGAATTACGG CGTAGTCTTA CAGTCTCGTT CTTATTCACA AGATACCAAA 
CTTTATGGCC CAAGGGTACG TTCGGTAGAT AGAAATATTC CTTGGATCAA TTACTGCGAG 
CACTCACGTC TATGCGTTGA TCCTTCGCAG CGGTGACTTC ACTCGTGGAA ATGGTAAATA 
AAATTTCTTC GGAGGATGAC TGTCAATTAT TTGATAGAAG TAGGTAGACC ACAGGTCTAT 
CTACTAGCCT CGCTGACTTC GTCTTTCTAA ATTTTAGGCA CCGGCGGGGA GTCGATTTAC 
GGTTCCAAGT TTGCGGATGA GAACTTTACT CTTAAACACA CTGGGGCAGG TACTTTAAGT 
ATGGCAAATG GTATGGCAAT CAACAGTGAC GGACATTCAT GGCCTCCGTG AACAAACACG 
CTGACCTCAT TTTGTGTATG TCTACAGCCG GACCGAACAC AAACGGTTCC CAGTTTTTTC 
TTTGCACGGC CGAGACGCCT TGGTTGGACG GGAAACATGT TGTGTAAGTC TGTCTCACAA 
AGGACAGTTT TGGCTTGCAT GTTTTATATA CTAGGTTCTC GGCTCACAAC TAACCAATGG 
CGTCTTCGTA GATTCGGCAA GGTTGTGTCG GGACAAGATG TGGTCAGCGC CATTGAGCAA 
GTAGGAAACG AATCAGGCAA AACTCGCGTT CCAGTCATTA TTGCGGATAG TGGACAGCTA 
CGCTAA

Protein sequence

MSQNPVVFFD VTIGGSAKGR IEMELRADVV PKTAENFRCL CTGEKGIGKL GKPLHFKGSA 
FHRVIPNFMA QGGDFTRGNG TGGESIYGSK FADENFTLKH TGAGTLSMAN AGPNTNGSQF 
FLCTAETPWL DGKHVVFGKV VSGQDVVSAI EQVGNESGKT RVPVIIADSG QLR