Gene PHATRDRAFT_41483 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_41483
Symbol
ID	7199291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011698
Strand	-
Start bp	279997
End bp	281484
Gene Length	1488 bp
Protein Length	495 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002185462
Protein GI	219130626
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCATCAAA AGGCTGTGGA TGACCAAAAT TACACGTATT CGTCATTTTG GTCGGTGAGG 
ATAGTATCGA TCGAAGGATT GTTGAAATTG ATCAAGCTGG ACAAGGTCGG CCAGCTTCGT 
CAACTCAAAC GCTTGCTAAG CAGGGTAGTA CTGATCACTA TGAGCAATTT AATAGTACCG 
TCATCACAAA CGCTCACACC GAGTAGACGT CGGCGGCCGA AGGACAACCT CTATCCTGTA 
TTCCTCGTCG TCTGTGGATT CTTTGGCTTG ATCCAGTTCT TCGATCCATT CGCAACTTTC 
GAAGGGAGCC CAGGTCATAG TAGCGAGAAT GCGAGTGCTT CAATTTCGCT TGCTCTGGCT 
CGGAGCAAGG TCCGCGACCA TGCTGAGAAG TTCCGGCAAA GGAAGGAGCG AGGCTATCCA 
CAGAGGATAC CCTCCTCGGT GACTGAACAA GCATTTCGCC AAAGTGATGG TATTAAGACC 
GGCGCCGTCA ACGCAACCAC GAGCCATGAA TGGCGGAGAA AATGGGACCA GCTTAAGGTG 
GGACGCGAGC CCTTATTTCA GATGCTCTTT GAGGATGCCA AAATGGGCGT TGATTCCGTT 
TCTTTACCAT CTCTAGAGGC CTTGCCGACT ACCGACGCTT TGCGACAACT GTATGGCGAC 
CGAGTAATTG TACGAGGACT AGAAACCTGT CAAAAGTACA GAGATACAGT GGCATTGGAA 
GATCGATACG TTGCCGTAGC AGGGACCTTC AACGTGGGCA CCAATCTCTT GGCCTTTCAT 
TTGGAAAACA ATTTGCGTTT TCCGAATCGC ACGGATGCAG GCAGTGGGAG GAAGGCACAC 
TGGCGATGGC AGGTGCGCTG GGGGAAACAT CAGCCAGCCA CAGTTCGCAA CCAAAACGTG 
GCCCGTGGCT TTGAAGCCGA CAATATCGAT CACGTGCTAC CCATTATTAT GATTCGGGAT 
CCACTCTTTG TGCTGCAGTC GCTATGTGCG CATCCGTACG GTGCACGATG GCGCCACGTA 
GATGGTCATT GTCCCAATTT AGTACCTAAC GAAGTGGATC GCGCCTACTT CAAAGGTGTG 
CCCGATATTT TCAAAGTTAC AATAGTGTAC GATAAGAGCC GGCAAACAAG ACACAATTCG 
CTGATTCACT TTTGGAATGA ATGGTACCGC GAATACTTGG ATCAATTTGA CTACCCCGCG 
CTCTGGGTTC GCTTTGAAGA TTTGGTCTAT AATCCACAGG CCATGCTGCA GCAAATTGCC 
ACTTGTATTG GAGGTGCTGC ACCCACACAC CAGAACTTTC AATACCTGAC GAAAACAGCC 
AAATCTCACG GTAGTGGAAC CAACATGCTG AAAGCTCTGA CGAAAACCGG TGACGCGGCG 
GCCCGCGTGC GGAATATGAC CGTTGCAGAC CTAGACTACC TCCGAGATCA CGCCGATCAC 
CAACTACTCC AACTCTTTGG CTACCGCATA CCAAATCCGG GGCGATAG

Protein sequence

MHQKAVDDQN YTYSSFWSVR IVSIEGLLKL IKLDKVGQLR QLKRLLSRVV LITMSNLIVP 
SSQTLTPSRR RRPKDNLYPV FLVVCGFFGL IQFFDPFATF EGSPGHSSEN ASASISLALA 
RSKVRDHAEK FRQRKERGYP QRIPSSVTEQ AFRQSDGIKT GAVNATTSHE WRRKWDQLKV 
GREPLFQMLF EDAKMGVDSV SLPSLEALPT TDALRQLYGD RVIVRGLETC QKYRDTVALE 
DRYVAVAGTF NVGTNLLAFH LENNLRFPNR TDAGSGRKAH WRWQVRWGKH QPATVRNQNV 
ARGFEADNID HVLPIIMIRD PLFVLQSLCA HPYGARWRHV DGHCPNLVPN EVDRAYFKGV 
PDIFKVTIVY DKSRQTRHNS LIHFWNEWYR EYLDQFDYPA LWVRFEDLVY NPQAMLQQIA 
TCIGGAAPTH QNFQYLTKTA KSHGSGTNML KALTKTGDAA ARVRNMTVAD LDYLRDHADH 
QLLQLFGYRI PNPGR