Gene PHATRDRAFT_48701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48701
Symbol
ID	7194685
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011686
Strand	+
Start bp	671356
End bp	673313
Gene Length	1958 bp
Protein Length	615 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002183137
Protein GI	219125751
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCAAG CTGCGTCTTC GACAATCAAC CGCATTGCTG AACTCGAAAA CGCGTCCGGA 
AGGGACAGAA TCAGAGAACA CGATGGCAAA CCCACAAGCG AGCCACCTAT TGTGCACAAA 
AACGAGGCCA AAAGCTCTAC CAGCTGCTCA CAGATTGTGC CCCACACTTC CCCTTCGGCC 
CTGCACCTTC TCAAATCAGC TGTGCAACGA GTGCAACAAG AAGAAATATT GGCTGCCGAG 
GCATTACCTA CACCTTTTAT AGGCGTTTTG CGATTTGGCC CTGGCAAAGC TGTCCCTAGG 
AAAAGAATTA GTCCTTCTGG TAAGCGGCCG AGACATACAA ATGACCGTTC ATTTTCTGAA 
GCATGGATGC TCGAATTACT CGACAAAGTC GATCCTGAAG CTATCAATCC CTTGGTAGCA 
TTTGCCGCAG CCTTAAAAGA CATCCCGGAT GAGGAGAAGA CTGGATACTA CAACACCTTG 
CGGGAAGCAC CCGACTTGAT TGCTTGTGAG TCGAATCCAC TCATTTTCTT AAAATTTCAT 
TCGGACAATG TCGAGGCAGC TGCTCAGCGC TTTGCACTGT TCTGGCAGGA ACGGTATCGG 
ATCTTTGGGG AAAGAGCTTA TCTACCGATG GATTCCACTG GAAATGGTGC GATGTCACGC 
CAAGATCTGA TCGTCTACAA CTCACAGTAC CTCTTTGTGT TGCCTCGAGA CGATGCCGAG 
GAGTCTGTTG TTTGCTATAC GCCGTCCTTA GTGGATGTGG ACTGTAAAGA GCGCATGAGA 
TGCGTTTTCT ATACATTTTT CCAAGTATTT AAGAATCCGA TGTCATCGAA AACAGGATTC 
ACTGCCATAA CAGTCTTCGA CAAGATTGGT ATGGAACGTG CTTACGGTAG AAAGCACCCC 
GCGGATCTGC TGCGAGATGC ATTTCCAATG CGAATGAAAA AAATCCATGC TGTTCTGTTG 
CTGGATAGCG AGCACGTGAC CTACTTCAAA CAAAGATCAG AGCCTCTATT TATACAGCTT 
TACTCTTGCC CCCTGAACAC GCATTTCGAG GGAACAAAAG AGGAGATAGC AAGTTCATTG 
GTTTCATCCG GGTTCAGAAG TGCTACTCTC CCGGAATCTG TCGGCGGCAT GCTCCGATAC 
TGCGATGTCG AAGAGGCTTT TACAAAACAA CGACAAAAAG AAACAGTAGA AGAAATAGAA 
CGCATGAAAA TGAGAAAACG CCTATCGGCA ACTGCTTCTG ACATTTCCGA GGCGGCCTAC 
GACCTTTCAG CCACGGAAGC AGATATCACA CGCTCGGATA GCGACGACAG CGCATCCCGA 
TGGAAGATGA GGCGACGACG TCAACTGAAC AACGAAGCGT CAAAGCGAAA GAGAAGAAAA 
ATCAAGCAAC ACGAACACGA TTTAGAGAAA CAATGTGCGG CATTGAGAGA GCAAAATGCA 
AGGCTCAAAA GCGGCAATTA TCAATTGCAA CGTCTTTTGA TACAGGCGCA AGAAATTGTC 
ACTGTGTATG AGGAACGCAT TCTCCACCCG AATCGTGCGA TTCAAAACAC TAACCAGCTC 
AATTCCATGA TAAGCAACGA AAATCATCAG GTAGTAGTCC AGCCCAGCAC GACTGCGCTT 
TCGACACCTG TACCCGTCAC TCGTCTTGCC GATGCTATAG GACAGCCTTC TGGTTTTTCT 
GCACACTTTC TACTCTCACC TGAAGATCCA TTTAAATCCA ACGCAGTGAG CCTGGCTGAC 
GTTCGTTTGC TCCCGGGAGG CTTGTACGAG CGACCAATCC AATCAGATAC CATCGGACAA 
AGCGAAACAA AAATGCCGGA TTGTGAACGA AAGGCCCGGG TACCTTAGTT TCATCGGCCC 
TAACATGCGG ATATGTCCAG CGCTATTTAC GAATAGAGTT CCTCTTGTGA AACGCGCTCT 
TTCAGTTTAT AGTACTAACA GTCAAATACT TGATGGAT

Protein sequence

MNQAASSTIN RIAELENASG RDRIREHDGK PTSEPPIVHK NEAKSSTSCS QIVPHTSPSA 
LHLLKSAVQR VQQEEILAAE ALPTPFIGVL RFGPGKAVPR KRISPSGKRP RHTNDRSFSE 
AWMLELLDKV DPEAINPLVA FAAALKDIPD EEKTGYYNTL REAPDLIACE SNPLIFLKFH 
SDNVEAAAQR FALFWQERYR IFGERAYLPM DSTGNGAMSR QDLIVYNSQY LFVLPRDDAE 
ESVVCYTPSL VDVDCKERMR CVFYTFFQVF KNPMSSKTGF TAITVFDKIG MERAYGRKHP 
ADLLRDAFPM RMKKIHAVLL LDSEHVTYFK QRSEPLFIQL YSCPLNTHFE GTKEEIASSL 
VSSGFRSATL PESVGGMLRY CDVEEAFTKQ RQKETVEEIE RMKMRKRLSA TASDISEAAY 
DLSATEADIT RSDSDDSASR WKMRRRRQLN NEASKRKRRK IKQHEHDLEK QCAALREQNA 
RLKSGNYQLQ RLLIQAQEIV TVYEERILHP NRAIQNTNQL NSMISNENHQ VVVQPSTTAL 
STPVPVTRLA DAIGQPSGFS AHFLLSPEDP FKSNAVSLAD VRLLPGGLYE RPIQSDTIGQ 
SETKMPDCER KARVP