Gene PHATRDRAFT_12989 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_12989
Symbol
ID	7201726
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011678
Strand	+
Start bp	849007
End bp	850098
Gene Length	1092 bp
Protein Length	363 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002180908
Protein GI	219120335
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GAGATAGCAG CTGTCATTGA GGCTCTTCGG GATGGATTTC TCGCCCCTGG ACCTAAAACA 
GAGGACTTTG AGCACCAGGT TTCGTCGCTC TTTGGCAAGC AACATGGGTT AATGGTGAAC 
TCGGGTTCAT CGGCAAATTT GCTTGCGTTA AATGCTTTTG GGTTCAAGCC AGGAGATGAA 
GTTGTCACGG CCGCCTGTAC CTTTGCAACT GTTATTGCAC CACTCCTACA ACTCGGAGTT 
AAGCCTGTCT TTGTTGATGT TGATCCTTCT GCCTATGTTC CCACAGTCGA CGCAATCATG 
GAAGCCGTCA CATCCAAGAC GGTAATGATT TGGCTGGCAA ACCTAGTTGG TGCAAAGCCT 
GACTGGGAAG AGCTACGCTG CCGCACCAAC TTGCCTCTGT GGGAAGATTC CTGTGACACG 
ATATCTGTTA CTACGGTAAC TGACGTTTCA ATGACCAGTT TCTATGCTAG CCATATGATT 
ACTGCAGGCG GAGGCGGAGG CATGATAATG GGTAACAACC GCGAATTTAT CGAAAAGTGC 
CGCATGTTCC GTGATTGGGG ACGAGTTGGC AACAACTCGG AGGCTCTAGA AGATCGCTTC 
ACTTCAAGTA TTGATGGAAT CCCATATGAT GGAAAGTTTT TGTACGGAGT AGTTGGATAC 
AACATGAAGT CAACCGAGAT GAATGCCGCC TTTGGACTTG CTCAGCTGAA GAAGTTGCCG 
TCCTTCCGTG CCATCCGTCG GGCCAACTTC GACCGCTTTA TGTTAAAGTT GAAAGCTTCA 
AAAACATTTG TTCTCCCCAA AGAGAAAAAG GCATTTGATT GGCTGGCTTT CCCTCTTTTA 
CACTCCAAAC GGGGTGAGGT TTTGCAGTTT CTGGAGGGCA ATGATATTCA GACTCGCGTA 
TTGTTTGCCG GAAATATCAC TCGGCACCCA GCGTATCGTC ATCTCTTTGT CTCGGAGAGT 
GCATTTCCCA ATTCTGATCG TATCATGGCA GAGGGTTTTT TGCTTGGTTG TCACCATGGA 
ACCACCTTTG AGCAGATCGA TCGTGCCTGC GAGCTCCTCT TGCAGTTTGA GAAGAATCTG 
GAAGTTATCT AG

Protein sequence

EIAAVIEALR DGFLAPGPKT EDFEHQVSSL FGKQHGLMVN SGSSANLLAL NAFGFKPGDE 
VVTAACTFAT VIAPLLQLGV KPVFVDVDPS AYVPTVDAIM EAVTSKTVMI WLANLVGAKP 
DWEELRCRTN LPLWEDSCDT ISVTTVTDVS MTSFYASHMI TAGGGGGMIM GNNREFIEKC 
RMFRDWGRVG NNSEALEDRF TSSIDGIPYD GKFLYGVVGY NMKSTEMNAA FGLAQLKKLP 
SFRAIRRANF DRFMLKLKAS KTFVLPKEKK AFDWLAFPLL HSKRGEVLQF LEGNDIQTRV 
LFAGNITRHP AYRHLFVSES AFPNSDRIMA EGFLLGCHHG TTFEQIDRAC ELLLQFEKNL 
EVI