Gene PHATRDRAFT_49735 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49735
Symbol
ID	7198429
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011692
Strand	+
Start bp	105886
End bp	107023
Gene Length	1138 bp
Protein Length	312 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002184486
Protein GI	219128578
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.15177
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GCACAAAAAA TTGCGTAGAA TGTTAATGAT TCACATGGAT CGTCTTACCC ATCAACAGCA 
CCACCACCAT CCTGTGGATG CTCGACATTG GGAAACGGAT TCCAATACAG ATGACGCCAG 
GTCCATTAAA TCGGCGAGTA TCAGCGGGAT GCTTCCATTG GCCTCCGACT TTAAACCAGG 
TCCTTACGAT GTAATTTGTG CTCGAGGAAA GGCGGCAAAA AACCACGTGG GTAACATTCA 
ATATCGGCTT AACGTGGAAC GGACGCTCGA GCAATACAGT GCCGCCAGTA CCAAGCTAGA 
AAAGTCCCAA ATCGTTTCCG GCATTGTGGA TTCCATTCGC GAATCCAGTC GCTATGGAGG 
TTTTGTCAAA GAAGAAGATG GTCGGTGGTT TGAAGTGGGA GACCACATTG CACGGGAAAA 
GGTGGGACAA AGGTAAGCGA TTCAGAGCTA TGAAGCATGC CCGATTGCCG ACGGGTCTTG 
TCAAATTTTG CTTATCCGAG TCTTCATCCG GTTTCGCAGT TTTCGCGACA TGCTACACAC 
GAAGTATCGA TCGAGTACGA GGGCAAAGAA AAAGCGACGT AAAGAGGAAC AGAGCAAAAT 
GGGTGACGAT GTTGACACGT TCATGCTATC CCATGCAAAC GTGGCTTCCA AAATGAAGGA 
ACTGTCCCAG ACGGCGCAAC AGCGAGGTAC GTTTGAGCGC CGGGTCTGCT TTGGTGTACG 
TGAGAAAGCC TTGAGTATCA CAAACCTTTT GCGCTCTCAC AATTTGTTAA AACCGTAGAA 
ACGGACCAAT CTATGGAAGA AATGTTCAAC AAAGCCAATG ACCAACTGTT GCAGGTTCTC 
AAGAGGGAAT CGCAACACCA GCAGTTGAAT GAAGCCGAAC ACACACCAGA TGGCCAAACT 
TCCCCAAACC TCGATCCGAT CCCCTTCGCG GCGGTCGCTC GTCGCACACA GATCCATCGT 
CCTCCGGAAC AAGCACCATA TTCTTACGGT CGCTTTGGGG AGTTGGCGTT TCTGGACGAT 
TCTTTGTCCG AGTCACGACC GCAAGTAGCA GAGTCGTCTT TGTCCCACCC GCACATCGAT 
TCTGCTTTTT CTGAATTCCA GGCCCCGCAG GATTTCAACC GCAAGCGCAC ACGCTGAA

Protein sequence

MLMIHMDRLT HQQHHHHPVD ARHWETDSNT DDARSIKSAS ISGMLPLASD FKPGPYDVIC 
ARGKAAKNHV GNIQYRLNVE RTLEQYSAAS TKLEKSQIVS GIVDSIRESS RYGGFVKEED 
GRWFEVGDHI AREKVGQSFR DMLHTKYRSS TRAKKKRRKE EQSKMGDDVD TFMLSHANVA 
SKMKELSQTA QQRETDQSME EMFNKANDQL LQVLKRESQH QQLNEAEHTP DGQTSPNLDP 
IPFAAVARRT QIHRPPEQAP YSYGRFGELA FLDDSLSESR PQVAESSLSH PHIDSAFSEF 
QAPQDFNRKR TR