Gene PHATRDRAFT_11940 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_11940
Symbol
ID	7200664
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011675
Strand	-
Start bp	748454
End bp	749596
Gene Length	1143 bp
Protein Length	330 aa
Translation table
GC content	56%
IMG OID
Product	predicted protein
Protein accession	XP_002179906
Protein GI	219118255
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ACGGCCGTTG TGGTCGGGCA AGCTGCGAAA CGACGGATTG ATTCCCATCC ACACCACACC 
CTGTATCAAG CCAAACGCGT TTTGGGGCGG CCCTCGGACG ACCCCGCCAT GACGGAATTG 
CGGGAGGAGG TCGAATTCGC CGTGACGGCC GACCCCGAGC ACGGCGTCGT CTTTGGTGTG 
CCCGAGACGT CGCGGCCAAT TTCACCACAG CAGGTGGGAT CGTACGTCGT CAGTCATCTC 
ATGAGAATCA CCGAAACCTT TTTGGGACAC GACAACATCA AATCGGCCGT TATTTGCGTC 
CCCGCCAAAT TCAATGCCGC GCAAAAACTC GCCACGTACC AAGCTTTCCG ACAAGCCGGT 
GTTACCGTCG CGCGTGTCGT AGAAGAGCCC ACAGCAGCCG CTTTGGCTTA CGGGTTGAAT 
CGGAAAGAAG GTGTGGATCA CATCCTCGTG TACGATTTTG GTGGAGGCAC ACTCGACGTT 
TCCTTGCTGC ACGTGAGCGA CGGGTTCGTC GACGTCATGG GCAGCGACGG AGACGATCGA 
CTGGGTGGTG CGGATTTTGA CGCGGCCATT GCTCACTTTT TGCTCGAGCA TCGCCATGGA 
CAGGCCGTAG TTTCTCGAGT CTCACAAGCG TTACAGTCAC TGGTCCAAGC TCTGCCCAGC 
AATGTGGATC TAGAAGACCA GCTTTCGGCA TCGTGTACGT CTCTACAAAC GGTGCCGCTT 
TGTACCGTAT CATCCTTCCA TACGTTAGGA GAACAACTCA AGATTGCGTT GTCGGCATAC 
CCGGATGGCA ACGGAACAGT CGAGGCGGAG TGTCTCGGAT TTCCCGAAGA CTACGTTGAC 
CCAGATGTGT CTCTCGAAGG TTTTTGCACC GACCTGACCA CTTTCCGGCT GTCGCTAACC 
TCTCGCGAGT ACGAACAGAG TGTGCAAGCG CTGTACGCAC GCTCCATTTC GCCCGTGACA 
CGCCTACTGA ACGACTTGAA TTTGCGTCAC GATGATGTTG ACGAGGTTGT CATGGTGGGC 
GGGACAACCC GCATCCCACA AATACGAAAA CTCGTTCAAC AGGCACTGCC ATCAGCATCT 
GTGAATACAC ATATTGATCC GGACATCACC GTGGCTTACG GTGCCGCTTC CGTAATAGAC 
TGA

Protein sequence

TAVVVGQAAK RRIDSHPHHT LYQAKRVLGR PSDDPAMTEL REEVEFAVTA DPEHGVVFGV 
PETSRPISPQ QVGSYVVSHL MRITETFLGH DNIKSAVICV PAKFNAAQKL ATYQAFRQAG 
VTVARVVEEP TAAALAYGLN RKEGVDHILV YDFGGGTLDV SLLHVSDGFV DVMGSDGDDR 
LGGADFDAAI AHFLLEHRHG QAVVSRVSQA LQSLVQALPS NVDLEDQLSA SYVSLEGFCT 
DLTTFRLSLT SREYEQSVQA LYARSISPVT RLLNDLNLRH DDVDEVVMVG GTTRIPQIRK 
LVQQALPSAS VNTHIDPDIT VAYGAASVID