Gene PHATRDRAFT_49575 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49575
Symbol
ID	7198239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011691
Strand	-
Start bp	89891
End bp	91092
Gene Length	1202 bp
Protein Length	375 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002184391
Protein GI	219128377
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00359533
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTTCGAAAGG CAGGAACTGA CTGTGACAGC AAGTTAAGTT CGGACTACCT GCGTATAATC 
CAAATGTAAC TTGCATGCTA CCGCTTTCGC TTTGGAATAA GGTATTCACC GCTACTGCTG 
CGGCAGCCGC GAGCAGTGTC GGTTGGTGGA TGTTGGATTG CCCGCCATCG CTGTACATCT 
ATGACAAGTT TCGGACTCTT TCTTCGCGAC CAGGTCGCGA AGGTTCCTTT CACGACAAGA 
ATGTGTGGAT AGTGGGGGCT AGTAGTGGTA TTGGACGTGA GCTCTGCTTT CAGTTGGCGG 
CCTCGGGCTG CACCAACGTC ATTGTATCGA GTCGCTCTAC CGACAAACTG GAACGAGTGG 
CGTCGGAAAC TATCCGTCGG TATCCCCGCA CGACCTGTCA CGTACTGCCC TTGGATGTGT 
GCGATGATAC GCAACTACAA CAGTGCGTAC AAATCTTGCC GTGTCCGGTC GATTTAGTAA 
TTTTAAACGC CGGTAGTGGA CACCTGTCGC CGGCTCTGGA AACGTCTCCC CGTACGGTCC 
GCAACATGCT CGAACAAAAC GTCGTTTGGC CCATGATTTT GATTCCTTTG TTACTCCACA 
GTGACTTTGG AGTCTTCCGG ACTTCATCTT CACAAATATT CCCACGTATT GCCGTAACGA 
GCAGCGTTGG TGCCGTTCTA CCGTTGCCGT TATCGTCCGC CTACGCCGCT TCCAAAGCCG 
CCTTGAACCG CTATCTCGGC TCACTGCGAG CCGAACGACC CGATATTCGT ATCGACATTT 
GGTGTCCTGG TCCTGTGGAT ACCGACTTTC ACGGATCCCA ATCAGCGGCA AACGTTGCAA 
CGCTTACAAA AGGAACCTTG GCCGACGAAT CGGTGTCATC GGCATCCGTC TCCCGGTCCC 
GGCTGAAAAT GCCAGTGGCT CGGTGCGTGT CACTGATGCT GTCGAGTTTG TTGCAAACTT 
CTCGACGCGA AGTTTGGATC GTTCCACAAC CAACCTTGAC CGTCTTGTAC TTGCAGGGAT 
TGTTTCCCGG TCTCGTGGAT TGGATGCTCT CCCTGATCGG TCCGAAGCGC GTTGCCCTGT 
GGCGCGCCGG TCTCGATTTG TACGATCCCG CTTCGTGGAC CGGAAGAAGA CCGACAGCGT 
CACTGGGCAC CTCCTCACAA AACAAAAACG AAAATAACGA GAGTGATTCC ACAACAAGGT 
AG

Protein sequence

MLPLSLWNKV FTATAAAAAS SVGWWMLDCP PSLYIYDKFR TLSSRPGREG SFHDKNVWIV 
GASSGIGREL CFQLAASGCT NVIVSSRSTD KLERVASETI RRYPRTTCHV LPLDVCDDTQ 
LQQCVQILPC PVDLVILNAG SGHLSPALET SPRTVRNMLE QNVVWPMILI PLLLHSDFGV 
FRTSSSQIFP RIAVTSSVGA VLPLPLSSAY AASKAALNRY LGSLRAERPD IRIDIWCPGP 
VDTDFHGSQS AANVATLTKG TLADESVSSA SVSRSRLKMP VARCVSLMLS SLLQTSRREV 
WIVPQPTLTV LYLQGLFPGL VDWMLSLIGP KRVALWRAGL DLYDPASWTG RRPTASLGTS 
SQNKNENNES DSTTR