Gene PHATR_36844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATR_36844
Symbol
ID	7204669
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011679
Strand	-
Start bp	492940
End bp	494088
Gene Length	1149 bp
Protein Length	382 aa
Translation table
GC content	54%
IMG OID
Product	predicted protein
Protein accession	XP_002185898
Protein GI	219121345
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCCTGGA ATACGCTCAT CGGGCAAGCC GATCGCGCCT TCCGTCTCGG TATACAACTC 
GAAAAGAACG GGCAACCCCG TAAGGCGAGT GCCTCTTTTC ACGAAGCCGC CACTCTGTAC 
CAATGCTATT TGGACTCGGA GAGTGAATTT GGACACGTCA CGTCGCTTTC TCAGGAAGAC 
AGTCAAGCAA TTTTAGCCTA CGCCTGTATG CGTCTGGCCT TCCTCAATCT CGACGCCCTT 
GGCGACCCCA AAGCGGCGGC TCGATTGTAC AAGGAAGCCT CCGCAATCGA TCCCTTTCCG 
TCCGCCGAAT CTTTCGACGG GATAGGCCAG GCACTGGAGG CTGCATTTGG GGGCCAGCAC 
TTGGAAGACG CCATTGAACA GTACCGCAAA GCGCTCGAAC TCGCGCCCGA GCGACAAGAA 
TCGCAATTTC ACGTCGCGGT TGCCTCGGAC CGCCTACAGC AATCCGACCA ATCCGAGGAG 
ATTTTTGAAC GATTGCGCCG GGACGAGTCC AAGTGGAGCT GTCTCGTCGA CTCGTGGGGA 
TATGTACGGT GGCATACGCG TAAAATCCCG AACGACAGCT TGTACTTGTA TCGCGGAACA 
CGGGATATTA TGGAAGTCGC CTTGAATGCG GCTCTGCCTT TGATCGAACA AGGTGGGCTT 
GTTTGCGAAT TCGGCGTAGG TAGTGGGCGA AGCTTGCGAA TGGCACAAGA TATTTTGCCT 
TTGGACGCTC GAATTCATGG CTTTGATACG TTCACCGGCC TCCCTCAAGC ATGGGGGACG 
GAACCGATCG GGACGTACTC GACCGGGGGA GTCGCACCGA ATATGGAAGG GAAGGTGACC 
TTCCACCGCG GTCTCTTTCG TGATACAATC GGTCCTTTTC TCAAAGAACA GGAGGAAAGC 
ACCTTTTTGG CGTACGCCAA CGTAGATTGT CAGCTTTATT CCTCCACGTT GGATATTTTG 
GAAGGCTTTC ACGGTTACAT TGTACCGGGC ACCATTCTAA TTTTCGATGA ATATATTTGC 
CATCCAAGTT GGCGGTATGA TGAGTTCCGG GCTTGGCGAG AATGCTGCAA ACGGTTTGGA 
TGGAAGTATG AATATCTTGC GTTTAGTCTC AGCACGAAGC AGGCCGTGGT TCGGCTGACG 
ACCGCGTGA

Protein sequence

MAWNTLIGQA DRAFRLGIQL EKNGQPRKAS ASFHEAATLY QCYLDSESEF GHVTSLSQED 
SQAILAYACM RLAFLNLDAL GDPKAAARLY KEASAIDPFP SAESFDGIGQ ALEAAFGGQH 
LEDAIEQYRK ALELAPERQE SQFHVAVASD RLQQSDQSEE IFERLRRDES KWSCLVDSWG 
YVRWHTRKIP NDSLYLYRGT RDIMEVALNA ALPLIEQGGL VCEFGVGSGR SLRMAQDILP 
LDARIHGFDT FTGLPQAWGT EPIGTYSTGG VAPNMEGKVT FHRGLFRDTI GPFLKEQEES 
TFLAYANVDC QLYSSTLDIL EGFHGYIVPG TILIFDEYIC HPSWRYDEFR AWRECCKRFG 
WKYEYLAFSL STKQAVVRLT TA