Gene PHATRDRAFT_32852 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_32852
Symbol
ID	7197477
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	-
Start bp	942755
End bp	944006
Gene Length	1252 bp
Protein Length	291 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002178039
Protein GI	219112575
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0416343
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTTCC GTTCCAACGG CTTGCCAAGA CATCGAAACG GAGTCTTCTT AATAAGTAGT 
TTGTCTCTGT TACAGTAATA TACACGCCGG TCGGATTGCT TCCCGTCACG AGCTGTGCGA 
TGGACGAAAC GACGTAGCTG CAGTAACTGT GAAGGGCCCA GCCTCCTTAC GGAAGTATTT 
GTGTTTGCAG TATTATACGA CCCTACACAT ACCCGCCCCT CTCATCCTTT ATGGCTGAAT 
GAACCGAATG AAGTAGTAGT CAGGCGATGA TCACGCCGTA CACTTGACTC CAGTACGTTC 
TCGCGCAGCG ATCGGTTCCC AAGCTGCGTC TACACCGACA CCTCTTTGGC CTCGGAAGTC 
CGGATTCGCC ATGAGCAAAC GGCTATTACC GACGAAAGAA GATGATTTCT GGACTTTGGC 
ATTGGACGAA AGATTGAAGA ATACGCAGAT CCTTCCTGCG GGTGAAGGTG TTGACTATTT 
TAATGCCACA ACGCGCTCCA TGTTGTATAA TATACCGTAT GGGGAAAGCA TGATAGTAAC 
CTTGCCCCTC TCGGACCTCC CCATGATTGA CGGCGCCTGG AGTCCAACTG GTTCCCAAGC 
ATGGTATGCT TCCGCATTAC TATCTGCCAT TCTTCTACAA GAATCGGACG AGCGTATCGT 
AGGGATATTG TGTAGGTCAG AGTCACTGTC AATTCTTGAG TTGGGAAGTG GAGCGGTTGG 
GCTTTCTGGG ATCGTGTCCA ACTTGCTGTT GAGCCGACGG CCGGGGACCC ATCGTGTCTA 
TTTAACAGAT CGCGATCCAA ATATTTTGAA GCAGCTCGAG CAAAATGTCA TGCAATATAA 
CGAACACCTA AGAAAGCACT ATCCCGCGAT AAAAGAAGAG CATATGGAGG TCCAAAATTT 
GGATTGGAAT GACGGATCGG CATGCTCGCG CTTAAAAGAC TTGGATCTAG TCATTGGATC 
TGAGCTGGTC TATACGCTAG AGACAGCCAA AGGCTGCGCA TCTTGTGTAC AAATTCTTCT 
TAAAAACAAT CCCAATGCAG TGGTAGTAAT TGTGCAAGTG AAGGATCGAG ACGGTTGGAG 
CAATATATTG GTTCCGACAA TGTTACTTTG TGGATACCAA GTATCCGAGG AGAGCATCCC 
AATCGGATGT GACGAAATAG CTAGCACTAT GATGCAGCAC AGAGGGATTT TGGATCAATC 
CCAGTTTACA GCCTGTTTTA TTTCAACACC GAGAGTAATT GGATCCGACT AG

Protein sequence

MSFRSNGLPR HRNGVFLIIR SRAAIGSQAA STPTPLWPRK SGFAMSKRLL PTKEDDFWTL 
ALDERLKNTQ ILPAGEGVDY FNATTRSMLY NIPYGESMIV TLPLSDLPMI DGAWSPTGSQ 
AWYASALLSA ILLQESDERI VGILCRSESL SILELGSGAV GLSGIVSNLL LSRRPGTHRV 
YLTDRDPNIL KQLEQNVMQY NEHLRKHYPA IKEEHMEVQN LDWNDGSACS RLKDLDLVIG 
SELVYTLETA KGCASCVQIL LKNNPNAHRG ILDQSQFTAC FISTPRVIGS D