Gene PHATRDRAFT_46074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_46074
Symbol
ID	7201424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011677
Strand	-
Start bp	157383
End bp	158606
Gene Length	1224 bp
Protein Length	380 aa
Translation table
GC content	55%
IMG OID
Product	predicted protein
Protein accession	XP_002180583
Protein GI	219119656
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTTTCGTGTG TGCATCACCC TTCTCCAGAA TTTTGACCAT GCCTCGCTGG CACGTTATTG 
GTAGAGTGAT GGCGGTCGCC GTCGGCTTTG AGGCAACGTC AAGTGGTGCG TTTTCGGTCG 
CACCCCGGAG GCGTTCGTCC CCACGATCCT TCCCGTTGGC GGTACGGCCG TCGTCGACCA 
CCGCGGCATC CTTGCCGCAG ACGACGCCGT TGCCGAAACA CACGTTTGCC GGTATGGTGG 
AACACGGAAT CCGCGAGCGC TTCGGAGACC ATGCCGATCG CGTGATTGAG TCCTGGAGAC 
TTCTAGACCA GGACTACGAA CACCAAGAAT TCGTCGGCTC CGGCGATCCA GAAACGAGCA 
ATTGCCACCA GTGGGCGCAT TCCTACGTCC CGGGCTTGTC CATCCAAGAG TTTTGGGATA 
CTGCGGAGTT TGGCTGGTGC CAAAGGCTCG AATCCAAGTA CAAGGCAATC CGCAAGGAGT 
TTCTCGCCGT CACGGCGGAC ATGGAACGGC TGACTAGGGA AGGCAACAAC GTTTGGGCCG 
GTGCCTTGAC GGAGGACGCA TCAAGCTACG GGGAAGGTTG GAAAACGTTG GTGCTGATGA 
ACCGGGGAAG ATGGGATCCA GTCAACGTTA ACCTCTTTCC CGTCACGTCG CAAGCAATTC 
ATGATTGTCA TGTTCCGGCC GCCGAAGTCT TTTTCGCCAG CATGAAGCCC AACTCGGCCA 
TCCAAAGGCA TTCCGATTTT ACCAACTTTG TTTTGACCAG CCATTTGGCT TTGGACATAC 
CGTACTCGGG CCAGAATAAA TGTCGCTTAA CGATTGGGGA TACAACCCGC GAGTGGATCA 
ACGGACAAGT ATCCATGTTC GACACGTCGC TCATGCACGA CGCGGTGAAC GAGGCCGATC 
AAACGCGATA CATTCTCATG ATGCGCGTAT GGCATCCCGA CCTGACCGAG GCCGAACGGA 
ACGCTCTACA GTTCACCTTT GATTGCTTGG AAACACCCGA GCTAGTGAGC GAGGATCCCG 
GCCAGCGATT CCTGGCGGAG CGGGAAGTGC AAGCCTCCCG ATCCTTTCCC CAAATAAAGC 
GCGACGTTAG CCGCGTTGTA GGCTTTGGCG GCAAGGCGAA AGGAGGAGCA AAAAAGAATA 
AGGCAAAAGC TAGCACTGGA GGAGGTCGTG GATTCAGTTG ATATTATAGT TTTACCGATA 
GTCCTATAAT CGATTCAGAA TCTA

Protein sequence

MPRWHVIGRV MAVAVGFEAT SSGAFSVAPR RRSSPRSFPL AVRPSSTTAA SLPQTTPLPK 
HTFAGMVEHG IRERFGDHAD RVIESWRLLD QDYEHQEFVG SGDPETSNCH QWAHSYVPGL 
SIQEFWDTAE FGWCQRLESK YKAIRKEFLA VTADMERLTR EGNNVWAGAL TEDASSYGEG 
WKTLVLMNRG RWDPVNVNLF PVTSQAIHDC HVPAAEVFFA SMKPNSAIQR HSDFTNFVLT 
SHLALDIPYS GQNKCRLTIG DTTREWINGQ VSMFDTSLMH DAVNEADQTR YILMMRVWHP 
DLTEAERNAL QFTFDCLETP ELVSEDPGQR FLAEREVQAS RSFPQIKRDV SRVVGFGGKA 
KGGAKKNKAK ASTGGGRGFS