Gene PHATRDRAFT_33840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_33840
Symbol
ID	7197874
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	+
Start bp	471180
End bp	472382
Gene Length	1203 bp
Protein Length	400 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002178231
Protein GI	219114871
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGACAT CGACTATAAG CGCAACGTCG ACCTTAGTCA AGGGTGCAAA TACTCAAGTC 
TCTAACCTAC GAAAGATTGC TCCGCAAGGG ACCGCTCGTA ATTCCTCCGC CATGAAGGCC 
CCGGCTGCGA TGAGAAAGCG TACGAAACGA CAAAGAAGAG GTGCGAGAAA GCCCACAGAT 
ATGCCTCGAC GGCCACTCAG CGCCTACAAT CTCTTCTTCA AAGAGCATCG ATCAGTCATT 
CTTGCTGAGC TGGAGAGCAG GGAAGATAAA GATAATTCTG GGCAAGGGAA GAAGGCCTCG 
ACAGCTAGTC TTTTCTCGAC TATGGGAAAG GCGATTGCGA AGCGATGGAA AGAGCTTCCG 
GAGGAAAATT TGACTCGATT GAAGAATTTG GCCAACGAAG ATATGAACCG ATACCGCAAG 
GAAATGAACG AATATCACCG GAAACTCGCG CAAAAAGCCC GTCTCGAAAC AAAGCCTTTG 
GACGATAAGA CTGAAATAGG AAAAGAAAGT GACAAGCTGC CCAATCCCGA GCAAGTGCAA 
GCTAAGAATG CTAACTCTAC TATGGAAGGA GCAGTCCGTC CTGTTCCCGC ACACACCATG 
CAGTATCTCT CTTCGTTTGG TGACACGATC CCTTGGCTGA ATACACGGCA GCTGCTATTG 
ATGCAACGGA ATCAGTTTTT CCGGAACCTT CCGCAAGTCA GTATCGGACA AGCGGGGATA 
GCCATGGGCG ACAGAGACCC TTTCGAGCAA CTACTGTGTG AACAAATAAT TCGAGCTCAA 
CTTCACAGTC AACAGCAGAC TCAGACAACT AGACTAGCCC ATTTTCGCTT TTTAGATCAT 
GAGGAAGCGC TACTTCAAGG CAGTGTCTCC GGTTCGGGCC GATTTCATGA AGCGAATGAC 
TACGCAGTCG GAAACAATGC AATGTTAGGA GTCGGCTATC CGGGTGCAAT CACCTCTCGT 
ATTTATGGAG CGGATGGTTT CCTACATCAA GGCTATGTGA CTCTTGGTCA GCATAAGACT 
GGCAGACAGT TCTTAAGTTA TACTGGACGA AGACAAGGAC AATACCAGCA ACTTTTAGCT 
CAGCAGCAAG TCGAGCGAAA CCTCGAGCAA TATTTGGCTA CCGGATCAAG CCCAACGTCC 
TTTGGATTGG TTGATTCGAA TAGATCAAGA GGAAATCATC CCTACAGGTC ATCATTACCT 
TAA

Protein sequence

METSTISATS TLVKGANTQV SNLRKIAPQG TARNSSAMKA PAAMRKRTKR QRRGARKPTD 
MPRRPLSAYN LFFKEHRSVI LAELESREDK DNSGQGKKAS TASLFSTMGK AIAKRWKELP 
EENLTRLKNL ANEDMNRYRK EMNEYHRKLA QKARLETKPL DDKTEIGKES DKLPNPEQVQ 
AKNANSTMEG AVRPVPAHTM QYLSSFGDTI PWLNTRQLLL MQRNQFFRNL PQVSIGQAGI 
AMGDRDPFEQ LLCEQIIRAQ LHSQQQTQTT RLAHFRFLDH EEALLQGSVS GSGRFHEAND 
YAVGNNAMLG VGYPGAITSR IYGADGFLHQ GYVTLGQHKT GRQFLSYTGR RQGQYQQLLA 
QQQVERNLEQ YLATGSSPTS FGLVDSNRSR GNHPYRSSLP