Gene PHATRDRAFT_49236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49236
Symbol
ID	7195534
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011689
Strand	+
Start bp	321454
End bp	322832
Gene Length	1379 bp
Protein Length	396 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002183854
Protein GI	219127254
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.011629
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTCTACAGGG AACGCTACAA ATCTACCATC ATGCATTTAT CTCTTCAGGC CATTAATGCG 
GACGACTTTG CTGTACTTGC CAACAAGCTA AAAGCTGAGC TTGGCCAAGA GAAAGGGAAC 
CATATTCACG GGAGCATTAT TCCGCACGAA AATGATATTC TGCTTGGCAG AGGTACGATT 
TCTAAGAGGT TCGAGCATGT GTTGAGCGCT CTCACTGATA AAGAAAACGC TTGTGTATTC 
GTTGCGCATC TCTCTCACCT GGCTTTTTTC GACCAAGTGT AGGAGGCAAG AATAACCAGC 
ACTTCGGAAA TATTCAACTG CGAAACATGA CTCGGCAATT CTGCTCCGCC TATTACGGCG 
CCACCAAAAA GGAAAAGCCC GCCGTTGCTC GAGGTTTGGT TCAATGTATC CAGAACTTAA 
ATCCACCGGG ACGTTTCCTG AAGCATTCAT TGGGAGGGTG GGAAGAGGCA ACAGCATCTG 
TCGCTCAAGA GAAAGCTAGC CAGAGCCTCC GTGATACGGT GGCGTCAGTC TTAAAGGAAG 
CAAACATCCA GGATGGCACA CACCCGAAAA ACGAAGTTTT CACTCAAAAA TGTCTTGACG 
AACTACATCC CGGGTCGAGT CGCCATCCTA AATCTGCAAC CAAAGATTCA GTCTTATTTC 
AAGATTCTAC TGAGCAATTG CCTAACAAAA TCGCCCGTTC ATATCAGGAG AGTGAGTCTT 
CATGTCAGGT TCGCATGCCC GATAGCTTAG CTGTGAACTT TGGCGACCAA ATGTTACTGT 
CGATGGACGC GACGTCGTCT ATCTCCCTCC AAGAAGAGTT CAATGAAAAT GGCAAGAGAA 
GTAGAATCTC TTTCTTAGAA GCCGATTTGA ATAGCAAGAT CCAACGTTTT TCTACGGATC 
GCGCCTTCTG CACCATGGGG CTTATAGACA ATTCCGATTT TAGTTCGATG GCTAACTCGA 
AGCCCCAGTA CCAGATATCG TCCCAGGTAA CAACCAGTCG TGTGCCATGC ACAACATCGA 
CAAAACTCTC GTTCGACACC TGGACTGGAA ATGGTGGCTT TAGCCTCAAT GATGCAGCTC 
GGTACGCTCA CCTCGCAGCG CAAAGGAAGA GGCAGTTCAG CACCAGCATA AACAGCGAAA 
GCAAGGAAGA TCAAGAGATT GAACTTTTCA GTGCTGATGC GCTCGATTCT ATTGTTTGGG 
ACGACGATGA TATCAAGCTT GATAGTACCT CTTCTTTTCA ACTTGCTCCG GGTCAACACC 
AGGCCGCAAG CGCTTGGGAC GACGAAGACG CTTTTCGTCG GCGCATTAGG AATCTCTTAC 
AGGAATTGTA GCCGCTGATA CATCATCATT TCTAAAATAA TATATTTGCT TGTGTGCGT

Protein sequence

MHLSLQAINA DDFAVLANKL KAELGQEKGN HIHGSIIPHE NDILLGRGGK NNQHFGNIQL 
RNMTRQFCSA YYGATKKEKP AVARGLVQCI QNLNPPGRFL KHSLGGWEEA TASVAQEKAS 
QSLRDTVASV LKEANIQDGT HPKNEVFTQK CLDELHPGSS RHPKSATKDS VLFQDSTEQL 
PNKIARSYQE SESSCQVRMP DSLAVNFGDQ MLLSMDATSS ISLQEEFNEN GKRSRISFLE 
ADLNSKIQRF STDRAFCTMG LIDNSDFSSM ANSKPQYQIS SQVTTSRVPC TTSTKLSFDT 
WTGNGGFSLN DAARYAHLAA QRKRQFSTSI NSESKEDQEI ELFSADALDS IVWDDDDIKL 
DSTSSFQLAP GQHQAASAWD DEDAFRRRIR NLLQEL