Gene PHATRDRAFT_54952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_54952
Symbol
ID	7195109
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011687
Strand	-
Start bp	278616
End bp	280186
Gene Length	1571 bp
Protein Length	415 aa
Translation table
GC content	55%
IMG OID
Product	predicted protein
Protein accession	XP_002183457
Protein GI	219126423
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.417126
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AACAAAACAA ACATAACGGT GAGACCGAAC CGAACGACGG GTGTTGTCTA CCTACCTACT 
TACCTACCAC AAGGCTGTTC CCCGTAAACG TTGTCGACCC GTCCAGAGTG TTTCATCGAC 
AACTCCTTAC GTATGAGTCG TTCCTGTTTG GTAGTTACGA CGCTCTTGCT GGCGGTGCTC 
GTTGCTGTGA GCCTGCCAGG CTCGACGGAT GCCTTTGGCT CGGTCCGGAT CGTCGTTCCA 
AGGACCAGTG TTCCCATGCA ATCAACAATA CCGCCGTTAC CTTACCGGAG CAGTTTATCG 
TCATCCATGG CCACGGCTGT GAATGGAGGA GACTCGTCCA CTGCTTCGAC GGCGAACGGT 
GCACACGATG ATGCGAACAA CAACGAGACG TTCACTCCCA ACCTCAACAT TCGTCTGAAC 
GTATCGGAAA AGGCCCGGAC CGTGACGAGT GTGTGCGTCT CCGGGACCCT GTGTACCGTA 
TCAGTACACG AGGGTATTGC GGGAGCTCCC TTTGGCTCGT TCGTCGATTA CGTACTGGAC 
GATCAAGGTA ATCCGGTCTT GCTCATGAAC GAAATGAGTA TGCACACTAT CAATATTCAA 
AACGCGGCAC AAACCCTCCT CGATGCCAGT GGCACAGCCA TTGGACCGGG CCCGTCCATG 
GTCACGCTAT TTACCCAGCT CGGTTCCGGG ACGACGTCTC TCAGTCCGCC GCGGACCGCG 
GCCGGCGGCG CCAGCGGTAC CGCCAAATCC AACAATCTAC AGGACGTTTC ACGTTGTTCG 
TTGACGGGAA CCCTGTACAA AATCGACCCC GCAGTGGATT CGGACGTCGA TGCCATCCGT 
ATGCGGTACT CACTGACCCA CACCTACGCC GACCAAGTCA TGGACAGTCC CAAATTTGCC 
TTTTACCGAT TGGTACCGGA AAAAATATAC TTTGTGGGCG GCTTTGGCGT CATGGCCAAG 
TGGGTGGATC CGGAAGACTA CGCCGCGGCC GCGCCGGATA TTCTGGCCAA GGAAGCCTCC 
GCGATCGTGG CCAAGCTCAA CCGTGAACAC GGGGAAGACT TGCAAAACAC CGCCCGGCAT 
TTGTTGCGGG TGGAAACCCC GTTGGAAGAC ATCCGCGTCA CCAACGTGGA TCGACTCGGC 
GTTGATCTAC GGGTCACGTC CCAAAAGGGA TCCCGACGCA ACAAACTGCA AACGGACGAA 
TTCCGTATCG GCTTTCGCAT TCCCGTTATT AGTGTCGAAG ACGCCAAATC AGAAATCCTC 
AAGACCTTTC AAGAAGCCTG GGAGATTGGT AACGGTATGG ATTGGGGCGA AGCGAACGGG 
AGCGACGGTG CCGCTACCTC GGTGCCCATT CTTAAAATTG CGGCCGACGG TTTGGAATAA 
TGCCAGCGCG CAGCCGCCGG CAAGGTAGGG TTATTGCCCT GGTGAGCGCC ATCTAACGAA 
AGACGTTCTA CTTCTTTTTT TGGAATGAAC CAACACGGGA TATTGTACTT CGTAGGAGAG 
CCATTCGGCA TTGGGACCGT TTGGAATAGG TGGAAACTAG CGTATAGAAT AGGGCCAGGG 
TTTGTCGTAG G

Protein sequence

MSRSCLVVTT LLLAVLVAVS LPGSTDAFGS VRIVVPRTSV PMQSTIPPLP YRSSLSSSMA 
TAVNGGDSST ASTANGAHDD ANNNETFTPN LNIRLNVSEK ARTVTSVCVS GTLCTVSVHE 
GIAGAPFGSF VDYVLDDQGN PVLLMNEMSM HTINIQNAAQ TLLDASGTAI GPGPSMVTLF 
TQLGSGTTSL SPPRTAAGGA SGTAKSNNLQ DVSRCSLTGT LYKIDPAVDS DVDAIRMRYS 
LTHTYADQVM DSPKFAFYRL VPEKIYFVGG FGVMAKWVDP EDYAAAAPDI LAKEASAIVA 
KLNREHGEDL QNTARHLLRV ETPLEDIRVT NVDRLGVDLR VTSQKGSRRN KLQTDEFRIG 
FRIPVISVED AKSEILKTFQ EAWEIGNGMD WGEANGSDGA ATSVPILKIA ADGLE