Gene PHATRDRAFT_49589 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49589
Symbol
ID	7198203
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011691
Strand	+
Start bp	133558
End bp	134719
Gene Length	1162 bp
Protein Length	332 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002184310
Protein GI	219128208
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.966771
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGGTTG AGATTATACC GGATATCGTC GATGACGGGA GCGAGTCCTC ACAAAGCTAT 
AACGTCGACT TTTCTCGTCA ATACGCCTGC GAGCCTTCCA CGTCTGCCTT TCCGAGTGGG 
AAGTACGATC GGGAAGGTGA AGGCCCCTGC ACTGAATGCG GGATGCAGAC TCATGATATC 
CAACACGATT TCCTTAGCCA ACATCAAAAA GTTCGTTTGA ACGTTGACCA AGAATTACGC 
AGGGGGCAGT GCCTCCTTTG CTTCCCCATC GCCTCGGAAG CTAGTCTTAA CCGGGTTGAC 
CCAAGCCGAC AATCAAAAAC TTGCGCCGAT GACAGTACGG ACACACATTG GAGTAGATGC 
AGCAAACGCA TGAAGCAGAC ACACCACATC GTTGCACGTC GTGTCTCCCA ATCCAACATG 
TTCAAATTCA ATCATTCTCT TGATGTGAAT GCTGAAATTG AGGAAATAAA GATCGGAGGA 
AGCTACGACA TCGCGGACAT TCTTTGTGCA ATGAAAACCG CCCCTCACGA CCACCTCATT 
CAAGAGCTCG GCTGCGAAAG TCTATGGATA CTCTCCTGGG AGGATGAAAA TGCAAGTGCC 
ATTGGTTGCG TCGGAGGGAT TCCAATGGTG CTCAACGCCA TGATTCGCTT TCCTATGAAT 
TCGCACTTGC AACAGTGCGC CTGCGAAACT ATTCAGAACT TAGCTTTGGA CGAACAGAAT 
CGTCGAGAAA TTGTCGAGCT TGGCGGGATC TCTGTTATTG TTAAAGCTAT GATGCGTCAT 
ATGGAGTGCG CCGGTATTCA GCAGTGTGTA TGTACAGCTT TGGCCAGTAT CGCCACCGAT 
CCGGCCAATC GTCCACTAGT GGCTGACGCT GGAGGCTACG ATGCCATTGC AGTGGCAGTC 
CGCAACTTTG CGGACAACGA ACCCGTTGCA CGAGCAGCCT ATGACGCACT TGCCATACTC 
GGTTTTCCAC AATGCACTTC ATTAGGAACC TGGCGGTAAC AACACAAAAT GATTTCATAG 
CGAAATCGCT TCTCGCAACA AAAACGAATG CAGGTGGATT TCATCAGAAG GTTGGGCCGA 
TTGAGAGTGA GCCCCCGTTT CCCACAATTC GTAATGTAAG TGAATTACGG TGACGAAAGG 
AAAGTAAGAA AAAAAAGGGT TG

Protein sequence

MPVEIIPDIV DDGSESSQSY NVDFSRQYAC EPSTSAFPSG KYDREGEGPC TECGMQTHDI 
QHDFLSQHQK VRLNVDQELR RGQCLLCFPI ASEASLNRVD PSRQSKTCAD DSTDTHWSRC 
SKRMKQTHHI VARRVSQSNM FKFNHSLDVN AEIEEIKIGG SYDIADILCA MKTAPHDHLI 
QELGCESLWI LSWEDENASA IGCVGGIPMV LNAMIRFPMN SHLQQCACET IQNLALDEQN 
RREIVELGGI SVIVKAMMRH MECAGIQQCV CTALASIATD PANRPLVADA GGYDAIAVAV 
RNFADNEPVA RAAYDALAIL GFPQCTSLGT WR