Gene PHATRDRAFT_49410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49410
Symbol
ID	7195904
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011690
Strand	-
Start bp	182862
End bp	184838
Gene Length	1977 bp
Protein Length	658 aa
Translation table
GC content	45%
IMG OID
Product	predicted protein
Protein accession	XP_002184200
Protein GI	219127975
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCAAAC AAAGGAATCG CAAAGCAAAG CCTCTCAAAT CAATACTACC TGATTGTCTC 
GATCCGATTG ACGAATCAAT TGAGGGATCA GAGTCATCGT CCATTCATTC GGAGAATTCG 
GAACCTGGAG TAGACTATTT AAAACCAGGA AAGGAGACGG CTCAACATAC GCAAAAAGAT 
AGCAACCAGC CAGAGATCAC TAAACAGTTG GACGAAGAAA AACAGAAGTA TTGTGATAAT 
CCTAGCTTTC GTTCTGCAGG CATTGTGTCA GGCGAACTCA TAAAACAAGA ACTTTTAGTA 
GCACCTTTCT TTCTACAGGG GACTCCTTCA CGATTCGAAG AGAATTTACA CTCAACGGAA 
GAATCAGGTT CTGTTACTCC AAGTATTCCG AACATCAGGA ACGAGCCTGT AAACAGCGAT 
ATCACGAAAC ATACTGTTCT CGCAAGTATG ATCACTCCGA CGGAAAACGT CTCGAACAAA 
TCTATTTTAG CGGTTGTCCG CGACGACTCC TCAGCCCCTT TGTTCAACTA TGACGACGAC 
TTCGACACCG ACGCTGTCGA CCCCGAAACG GAAGAAGAGC AGTTGACCTG GCGGATGGAC 
CCGTCCAAGA GCTTGAGTGA CTGGAAAATC AAGGTAACCA ACAAGGAGAC ACGGCAGAAC 
GAATTATATC ACGTTCACAA AAATTTACTT GCTGTTGGGC CCAAAAAATC TGAGTACTTC 
GTCCGTATTT TTCGAACCAA TAATCGTCTT GATGTGGGAA CCAGTACCAC CGACATCTTT 
ATGGAGAGCG TGGCTGCCCA CGTGATTCCA CAATGGCTGG ACTTTCTCTA TTCGCCCGAC 
GATGAGCTGG TCATTGACAC ACAAAGTGCA ACTGGCCTCC GTCATCTGGC TCAGTTCTTC 
GGAATGCGTT CCATGCACAA GAAGGCCATG GAGTTCATCG TACAAGATTT GTCCATGACA 
AACGTGATTG TCTACTACAA GGATAGTGTT GTACTAGCGG ATGACAAGAT TTCCGAGCTT 
GCTGCCAACC ATTGTAGCAA CAACATACTA TCAATTGATA GCAAGCACGA GCTACTCACG 
ACGGTCGACC CTTTCTTCTT CCGAAGATTG ATGACAGGTC CAGAGATAGA CAGTAGAAAG 
AAGCAATATC ATATCAGTTC TCTCCTGGCT GAGTACTGCG CACTGAATTC GAACGTACTT 
GATGAACAGT CATTTGAACG ATTGACGGAT GAGAAATATT TGCCACTCGT GGACCGAAAT 
GCTGCGTTGA CTTTATTGGA ATTGGAGGCT GATCTTGTGT TAATCAATTC TTCTGAAGAA 
GAGAAAAGCG AGTTGACGAG TTTACAATTA AGGTGCATCA AGGACTTGAC GCTGTATTGG 
CAAGAGCTAG AGGTTATGGA ACATGATAGG ATTATGCGTG TTTGTCGCAA ATTACCATCC 
ACAGTTGTTG CTGACCTTTT GGTCAAATCG CTAACCCAGG CCAAAAAGAA AGTTGATGAG 
GTTGAAGCTC AGTCTGCAGC TCAGACAGCA GCGGTAAAGC TAACGCGATC AGGATCGGCG 
AAATCTCTTG CCTCAGAAGA AAACAGCAAA ACGGATTATA GAGACATGTC TTCAAAATCA 
GACAATGGAA AAATGAAGGA AGTTCGTAAA GAGTACGACG CCAAGATGTC GAGTCTGAAA 
CGAGAACATC AAAAATCAAT CGACAAGATC CAGCGAGACT TTGAAAGCAA GCTTTTGAAG 
CTCCGAGATA TTTGTGTTGA AAAAGATAAA CACATCGCAA ACTACTGGGA CGAGCTAAAG 
CGTTTTCAGC GTTTGCCAAA CCAGCCTGAA GGAAAGATCA TTCCGTCTGG TCTAATGGCA 
AAAGCGACCA AGATGCCGGA AATTGGGAAT CAGCCACCAG ATGGATATTT GCTCGTCGGA 
AAGGGCAAAA CTCCATCAAA ATACCCTGTA TTCTTCTACA ACGGCGATCA AGTCTAA

Protein sequence

MGKQRNRKAK PLKSILPDCL DPIDESIEGS ESSSIHSENS EPGVDYLKPG KETAQHTQKD 
SNQPEITKQL DEEKQKYCDN PSFRSAGIVS GELIKQELLV APFFLQGTPS RFEENLHSTE 
ESGSVTPSIP NIRNEPVNSD ITKHTVLASM ITPTENVSNK SILAVVRDDS SAPLFNYDDD 
FDTDAVDPET EEEQLTWRMD PSKSLSDWKI KVTNKETRQN ELYHVHKNLL AVGPKKSEYF 
VRIFRTNNRL DVGTSTTDIF MESVAAHVIP QWLDFLYSPD DELVIDTQSA TGLRHLAQFF 
GMRSMHKKAM EFIVQDLSMT NVIVYYKDSV VLADDKISEL AANHCSNNIL SIDSKHELLT 
TVDPFFFRRL MTGPEIDSRK KQYHISSLLA EYCALNSNVL DEQSFERLTD EKYLPLVDRN 
AALTLLELEA DLVLINSSEE EKSELTSLQL RCIKDLTLYW QELEVMEHDR IMRVCRKLPS 
TVVADLLVKS LTQAKKKVDE VEAQSAAQTA AVKLTRSGSA KSLASEENSK TDYRDMSSKS 
DNGKMKEVRK EYDAKMSSLK REHQKSIDKI QRDFESKLLK LRDICVEKDK HIANYWDELK 
RFQRLPNQPE GKIIPSGLMA KATKMPEIGN QPPDGYLLVG KGKTPSKYPV FFYNGDQV