Gene PHATRDRAFT_49237 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_49237
Symbol
ID	7195700
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011689
Strand	+
Start bp	323854
End bp	325352
Gene Length	1499 bp
Protein Length	414 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002183855
Protein GI	219127256
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.178302
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATCGAAACAG CTCCGTATAC AACTAAAAAC GTGCGAAATT CATCCAAAGG ACGGCAGCGC 
AGCCCATCCC AAGCTCCGCA AAAAGGAAGA ACGCCCTCTT TTAACTTACT ATGCACCACG 
ATTCCTTCGG CAGCTCTACC GGCTTTCGTG GCGTCGATGT TGCCGTTCTT GCACGGCCAC 
ACTTGCTGAT TGCAAACATC AGAGCCCACG AAAACGACAT TCTGCTCGGG CGAGGTACGT 
GTCGGAGACG CTTCAAGTGA GCAACGACGA CTGTGGAATT CTCGGATCTA ATAAAGATGC 
GCCCATGTTC TCTTTTTCCA TTGCGAATCA GGTGGAAAGA ATAATCAACA CGCAGGGAAC 
CAAAAGCTTC GACGGATGGC TCGCCAGTAT TGCGCGCGGT ATCATGCCGC GGCGAAGAAG 
CAGAAGCCTG TGATTGCACT CGAACTCGTC AGGCAGGTCC ATTCCCTGTC CCCGCCTGGA 
CGTTTTCTGA AGCACAAAAT GGGAGGTTGG GAAGAAGCCA CGGAAGATAT TGCGAAGGAA 
AAAGTCAGTC AATGTCTACG AGATATCGTA GCGTCTCAGC TCAAAGCTGG AAATTCTCTA 
TCTACACTGG AGGAAGCGAC GATACATGTC AATTGTCGAA CTTTTATGGA AGCGCCGCCT 
TCCAATACCT TCCAACAGTA TACCAATCAT GTTACTCCTT CTGCTTCACC AAGCGCAACA 
AGCCACTCGC AAAAGCAAAT GTTTGACTGG CAGCAACCGA TGATGCAACC GTACCGGAAC 
GATAGTTCCG GAGTCCGGTA TATCTCCCCA CCGGATGTAT CAGCAAAAAG GACGATGCAC 
TGCATACAGA GTCGCTCCTC TTTTGAAGGA ATGAGAGAAT TCCGACATCC GTATCCGCAT 
GGCGTTTGCT CAACAATGAA TGTTGGCGTG TCCCGGGAAC GTCACATACA ACACCAAAAG 
AGACTAAGTT CGAACCCGAT GAACTCAGGT TGGTGTCAAG GTCCTTCAAA GAGAGTACGT 
GAGGGATATC AGGACATAGC TCCACGACAG CCGCGTCATC CGCAACAGGA TTACGGTCAA 
ATGGAACAGT TTGACGTAAA TTTACTTTCC ATGGAGCAGC ACGACGCCGC CCGCCACATG 
CCTACGCCTT TCGTGAGCTC CGAGTCTTCG AAAACTCGAG GCCAGGAAGA CAACTTTACG 
TTAAACTCGG CGGCGCGACT GGCTTACATG GAGCGTCAGA ATGGGGTATT CTCACAACAG 
CAAAACTTCC AACGTCACCA GAGTGACCTT CAACAGATTA AGGACGTGGA TATATTCAGC 
CCCGAGGATA TTGAAGGCAT CGCATTTGAA AGCATGGATG AATTTTTACC TCCACCTTCC 
GTGCAGTCAG CCCCATCCCA GGACGATGAC AACCTTCGCA CTTACGTCTT GCGCATGCTC 
CAGGAGCTTT AACCTGAATT TTGACTGCAC CTAACATAAG TAATCTGGAA TATAAGAGC

Protein sequence

MHHDSFGSST GFRGVDVAVL ARPHLLIANI RAHENDILLG RGGKNNQHAG NQKLRRMARQ 
YCARYHAAAK KQKPVIALEL VRQVHSLSPP GRFLKHKMGG WEEATEDIAK EKVSQCLRDI 
VASQLKAGNS LSTLEEATIH VNCRTFMEAP PSNTFQQYTN HVTPSASPSA TSHSQKQMFD 
WQQPMMQPYR NDSSGVRYIS PPDVSAKRTM HCIQSRSSFE GMREFRHPYP HGVCSTMNVG 
VSRERHIQHQ KRLSSNPMNS GWCQGPSKRV REGYQDIAPR QPRHPQQDYG QMEQFDVNLL 
SMEQHDAARH MPTPFVSSES SKTRGQEDNF TLNSAARLAY MERQNGVFSQ QQNFQRHQSD 
LQQIKDVDIF SPEDIEGIAF ESMDEFLPPP SVQSAPSQDD DNLRTYVLRM LQEL