Gene PHATRDRAFT_48898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48898
Symbol
ID	7194973
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011687
Strand	+
Start bp	623404
End bp	624633
Gene Length	1230 bp
Protein Length	404 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002183395
Protein GI	219126293
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CCAGCGCTAT CTGAAATGTG GCTTAAAAAG CATTTACTGG CAGTAGCATT GCTTTTGGCC 
TGTGTGATTG CTACGACCCT GTTCCAGTTT CGTGCCTTTC CCGGCCTACC ACTGCATCAG 
GCACCAATTG CAGTGCGCCT TTCCAAAGTC AAAGAGAAGC TCAAACAAGA AAATTCCAAG 
TCGCTACGAC CAGACCCGGA AGCCCTTCAC CAAGAGAGTG GAACATCGAC CGCGCGAGGT 
AGATGCGCCA TCAATCTATT TGGGTTACCC AGAGCTTTCC AATCACTAGT ATTGCCTTCG 
CTTGTTCAAA ACGTGCTGTC TCCTAACTCT CTTTACCAAT GTGACTATTT TGTGCATTAC 
TACTTCTTGA CATATGAAGA AGCGGGACGA TCGGGCCTTG GTGGCCGCAT TGATCCGGAC 
GAAATCTTGC TACTGGAACA AGCCGTTAGA GATGTCTCGC CAAATTCGGT CATCTCGTTC 
CGATTTGATC ACGAACAGGC CTTTTGGGAT AAATACCAAC CATTCATTGA CAAGATACGG 
ACGGCCAAAG ATACAGATGG ACGCTTTTTG TATTTTCCTT GGCGTGATAC ATCGTACGTT 
TATCCAGAAA CGCTAGATAA TATTGTCAAA ATGTGGCACA GCATTGAGTC GGCTTGGGAA 
GTAATGACGA AGCATGAACT TGAGACGTCT TTGCGGTACG ATCGCGTCGC CGTACTGCGC 
TCCGACGTTG TCTACGTAAC GCCAATCGAC GTTTTTCAAG ACAATTGGCG ACTAATCAAT 
GATAGCGACC GAGTAGCTGT GGTTCCTGCC TTTGGTAGGT ACCCAGTCAA TGATCGCATG 
ATTGTGGGAC CGCGAGAGGC CGTGGAAATA TGGGCTGCAC AGCGATTTAA CCGGCTGGAG 
ACGCATATAA AGTTTGTGCA GGAGAATCAT CCGGGATGGG GTATGCATTC AGAAAGATTT 
ATCAAATGGA CGATAAATCC GGCCATTCGA GATAGCAACA CAACCATAGT CGAAGACGGC 
AATATATGCT TTTTTCGCGT CCGTGCGGAC GAGACGGTGA AGATCAATGA TTGCGAGGAC 
GGCAAGAGTG TGGTGGCTGC TCCATCAATT GTTGAGAATA CAGGTGAAGG CAAGGCCAAA 
CTGTTGGAGT CGATCCTGGG TCGCAAATGT TTGGTCCGGC CTCCAGATTC AGCGTCTACC 
AGTTTGCAAT GTCCAAAAAA CATGACATGA

Protein sequence

MWLKKHLLAV ALLLACVIAT TLFQFRAFPG LPLHQAPIAV RLSKVKEKLK QENSKSLRPD 
PEALHQESGT STARGRCAIN LFGLPRAFQS LVLPSLVQNV LSPNSLYQCD YFVHYYFLTY 
EEAGRSGLGG RIDPDEILLL EQAVRDVSPN SVISFRFDHE QAFWDKYQPF IDKIRTAKDT 
DGRFLYFPWR DTSYVYPETL DNIVKMWHSI ESAWEVMTKH ELETSLRYDR VAVLRSDVVY 
VTPIDVFQDN WRLINDSDRV AVVPAFGRYP VNDRMIVGPR EAVEIWAAQR FNRLETHIKF 
VQENHPGWGM HSERFIKWTI NPAIRDSNTT IVEDGNICFF RVRADETVKI NDCEDGKSVV 
AAPSIVENTG EGKAKLLESI LGRKCLVRPP DSASTSLQCP KNMT