Gene PHATRDRAFT_17728 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_17728
Symbol
ID	7196813
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	1748345
End bp	1750131
Gene Length	1787 bp
Protein Length	509 aa
Translation table
GC content	45%
IMG OID
Product	predicted protein
Protein accession	XP_002176843
Protein GI	219110183
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.304466
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTATCCCCAT CTAGTAGTAG CCCCAGCGTC AGTTCTCTCA AACTGGGAAC GAGAATTTGA 
AAGGTTTGCC CCTCATTTGA ATGTTGTAAA ATACCACGGG AGTATGAACG AACGTTCAGA 
GTTGCAAGAG GATCTACGCA TTTATTTACC AAGCAATCGA GCAGCTCGCA AAAAGCACAA 
AGTGACACCA CTAGACGTTA TACTAGTGCC CATCACCTAC TTTCAAAAAG AGAAATCGGA 
CGATCGCTCA TTTCTTCGTC GCTTCAACTA TCACTACATG GTGGTGGATG AAGCACATCT 
ACTAAAGAAT GCCAAAGGAC TGCGATACAA GTCACTGGAT CGCTTCACAA CGCTCCATAG 
ACTGTTATTG ACAGGTACAC CCGTTCAGAA TTCCCCCAAG GAGCTGATGT GTTTGTTATG 
CTTTCTCATG CCGTTGTTCT CGCGAAAGGG AGGAAGCGAT TTTGATGATG AACAAGGGAA 
TGATGGTGGA GAAAGTATGC TACAGCACTT CGTGTCGATG GAAGGAGGGA ACACTCTGCA 
TGACGAGACA GCGTACAAAA AGCTGAAGCA GCTATTTGCC CCCTTTGTCT TGAGACGTAG 
AAAGCAAGAT GTCCTTAGTC AGATCATGCC TCCAAAAGAG CACGCTGTGG AGATTGTGCA 
GCTTGACGAG TCGTCTCGTT GCCTCTACGA TAAAATCATT TCCGACCATA TTCGTTCCAA 
GAAAAAAGGC GACGCCTCGT CGAGAGAGCA TTTGTTTACT CAACTTCGAA AATGCGCTCA 
TCATCCGCTA CTTCTTCGAG CTCGGTATAC TTCTCCGACC GAGAAGGAAC ATTTGGCGAA 
ATGGTTTTAT CAGTACGGTG CCTTTCGTGG AGAAGGGTGT ACAATGGTCA AAGTTCGCGA 
GGAATTGGAT CGATTCAACG ACTTTGAAAT TCATTTGACT GCTTTAGAAT TGCTGGAGGA 
GAATCGACTT CGTCACGAGC AACTTGGTCG TTATGTTTTG CAAGAGAAAG ACTTGTTTTC 
TTCAGCAAAA TGCAAGCGGC TTCGGGCCAT TCTACCGGAT TTGGTTGGTA AAGGACACCG 
TATCTTAATT TTTTCCGTTT GGACAAGTTG CCTGGATCTG CTAAGTTGTT TGATGGAACA 
AATGGGTCTA GGGTATCTAC GTATGGAAGG CAGCACACCT GTCAACGAGC GACAGGCCCT 
GATCGATCGA TTTACGAGCG AGACCAGTAT TCCGGTTTTT CTGCTCTCCA CGAAGGCGTG 
TGGGTTGGGT ATCAATTTGA CTTGCGCGGA TACCTGCATT ATGCACGATC TCGACTTCAA 
TCCTTTCAAC GATTTGCAAG CGGAAGATCG TTGTCATCGT ATTGGGCAAA AGAAACCTGT 
CAAAATTATC AAAATGATAA CGGAGGATAC AGTTGACGAG GATATTTACA AAATGCAGCA 
ACGAAAGGCT CGAATGAATG CTGCCATCAT GGATACAGAT TCTAGGGAAT GGAACAACGT 
TGCCGCCAAT GAAAAGGGAA ACATGCTGAA ACATGCAGTG GATCGCTTTT TGCGTTCACC 
CACCCAGTCA AGGTCTTCGA AAGAAAGAGG TGACAAGGAA AATAGCGGCA ATATTGACAT 
GACGGATGTA TAAACTGTGC AGCAACACAG ACTGGATGCC AGAAAAAAGT GGCCAGTTCC 
ACTTTTTCTT TTTCAAATTG TACATAGCTT TCCGACAGCT ATTCAGTCAT CTCAATGGCA 
TGGCAGTCCA GTTAACTCGA GAAATATTTA GTCAGCTTTA TGAACCC

Protein sequence

MNERSELQED LRIYLPSNRA ARKKHKVTPL DVILVPITYF QKEKSDDRSF LRRFNYHYMV 
VDEAHLLKNA KGLRYKSLDR FTTLHRLLLT GTPVQNSPKE LMCLLCFLMP LFSRKGGSDF 
DDEQGNDGGE SMLQHFVSME GGNTLHDETA YKKLKQLFAP FVLRRRKQDV LSQIMPPKEH 
AVEIVQLDES SRCLYDKIIS DHIRSKKKGD ASSREHLFTQ LRKCAHHPLL LRARYTSPTE 
KEHLAKWFYQ YGAFRGEGCT MVKVREELDR FNDFEIHLTA LELLEENRLR HEQLGRYVLQ 
EKDLFSSAKC KRLRAILPDL VGKGHRILIF SVWTSCLDLL SCLMEQMGLG YLRMEGSTPV 
NERQALIDRF TSETSIPVFL LSTKACGLGI NLTCADTCIM HDLDFNPFND LQAEDRCHRI 
GQKKPVKIIK MITEDTVDED IYKMQQRKAR MNAAIMDTDS REWNNVAANE KGNMLKHAVD 
RFLRSPTQSR SSKERGDKEN SGNIDMTDV