Gene PHATRDRAFT_48737 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48737
Symbol
ID	7195000
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011687
Strand	+
Start bp	111170
End bp	112645
Gene Length	1476 bp
Protein Length	331 aa
Translation table
GC content	45%
IMG OID
Product	predicted protein
Protein accession	XP_002183292
Protein GI	219126078
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0824211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

AAAAATCTTC TTACGTCAAT CGTAGACAAT GTTACTGTTA GTCTGTCTCC AGTGGTCTAT 
ATTACTCCTT GCGTTCGAGT CAGGGCCCTT TGCTTCTCAG CTAACTCAAA GACATAACTC 
ATGCATCTAG TTTCAATTGC GGGTCGAAAT TTGCTTTACA GCCATTCGAA AAATTATCGG 
TCTCCTTGCA GTCTATTATG AACTTTTCTC AACCTCGTTT TGCGAGGCAT CGTAGCTGGC 
GAAAGTTGCT TCCCGTACTT ACGGTTCTCA GTCTACTCTC TTTTGGATTC TGGAATTGCT 
TTGCTCGGAC CGGGGATTCA CTAGAAAGCG AGATTCGCAA AGATGCCCTC GGCGCGCCGA 
ATGGTATGCC GGCTGAGCTT TCAACAGCGC TAGCTTACAA GCAAAGTTTT GGCTTTTTTG 
ATGATATTCT TGACGGGGCA TGGAGGAAAA TGCAGGAACG TGCCAGAATT TTTATTCAAT 
ATTCGAATCC CCACAATCCA AATCAAGGTC AAACCGATTC GGCCAGGTGG TATGTTGAGA 
ATCTTGAACC TGATTTTACT TGTCCACAAG TTCAGCGGGT CGGAGGACAC GGTGATGGAC 
CGAAATGGAC CTGTGATCCT AATCGGCTTT TGAAAGAAGA ACCATGTCTG ATATACTCGG 
TTGGCTCCGC AGGTAAATAC CAATGGGAAG ACGGCCTGAT CCACCTCTTG GGAGGTACGC 
ATTGTGAGAT TCATGTGTTT GATCCGGGAG CTTTTGCACG ATCCAGGGAC GTGGAGGACA 
AAAATATTCA CTACCACCAG TGGGGATTCT CAAGCAGCTA TGTTAAATCA TTTGTACCCG 
ATATTTATTC CATGGGAGAA GCTTCCGGCA AACCAGTTAT GAAGACATTT CAGGATACCT 
TACGAGAGCT CGGTCACGTA CATCGTACAA TCCATGTTCT GAAGCTAGAT TGTGAGGGCT 
GTGAATGGTG AGTAAGACTG TGTTCACCCC ACTCTATTGC CGATTGCAAA CATGTCTGGT 
TTATTTTTCC GTCGCGGATT GCTCACTTGT TGATGTTTGC GAAGGGTGAA CTACAGGGAT 
TGGATTGAAC TGGACATTAG GCAGGTATTG ATTGAGACGC ATCAGCTTCC TGATCGACGA 
GCCGGGCCTG GTGCGCTGAC GCCTTCCACT TTTTTTGATG AATTTCGGAA AAACAACTTT 
GCGATGTTTA GTAAAGAAGC AAATGTCATC GCCCAAGGAA CATGTGTTGA GTTTGGATAC 
GTCAAGCTAC ATCCTGACTT CTGGCACTGA TAGTGATAAC GCATGTCTTT CGCTTACTCA 
CCTTTGAGCG ACCACTGACA GTGAGTGCAG GACGCAGTTC GCTACTTGCG GATTTGAAAG 
TTCTCTATAG TTTAATTTGC GAGGCTTTGG AGGATAAAAT GCAATGGTAA AAACCGATTT 
CACAGGCAGA CTTATATAGA CAGACAGTAA ATTGTC

Protein sequence

MNFSQPRFAR HRSWRKLLPV LTVLSLLSFG FWNCFARTGD SLESEIRKDA LGAPNGMPAE 
LSTALAYKQS FGFFDDILDG AWRKMQERAR IFIQYSNPHN PNQGQTDSAR WYVENLEPDF 
TCPQVQRVGG HGDGPKWTCD PNRLLKEEPC LIYSVGSAGK YQWEDGLIHL LGGTHCEIHV 
FDPGAFARSR DVEDKNIHYH QWGFSSSYVK SFVPDIYSMG EASGKPVMKT FQDTLRELGH 
VHRTIHVLKL DCEGCEWVNY RDWIELDIRQ VLIETHQLPD RRAGPGALTP STFFDEFRKN 
NFAMFSKEAN VIAQGTCVEF GYVKLHPDFW H