Gene PHATRDRAFT_21897 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_21897
Symbol
ID	7202930
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	-
Start bp	784764
End bp	786364
Gene Length	1601 bp
Protein Length	351 aa
Translation table
GC content	50%
IMG OID
Product	G protein beta subunit
Protein accession	XP_002182135
Protein GI	219123650
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.173476
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CATCACAGAG TCTCCTGACT AACTGTAAAA AAGGGAGAGC GATCTACTCT TGCAACTCAC 
CAGTCATCAA TACCACGCGT TCTTAGTTCC AATCTGTGTG TCTCGGCTTA CCCCAAGCTC 
TAATTTTTGT CTACATTTGG TCGAGAGCGG AAAATTGAGA TCCCAATATC TGCCTGTCCG 
CCTCCTGCAA GCTCGCTTAC TTTCGTGCTA GTACGAACCA CCATAAAGAA GTAAAGTCAT 
GTCTACTTCC GAAATTCAAC AGGATACTGC TAGAGAGGAG GTACGTTGCT CATCTTCGAT 
TCCTTTCATT CTGTTGCTGA CCGTTCACGA TATCCGGAAA TGTGTTGGGA AAGATTCCCT 
ACCTGGAAGA TACACTTTCC AACACTAGCA TACTTGTTTT TTGGCATCCG CCCCTGATCT 
TTTCATGCTG GGAAAACAAG AGGCCATTCA ACGTCTCTTT TGCTTCAAAA CGGAAACGGT 
GTCATTCCAA ACCCGCCTCG GTCTCTCACT CGGCTTTTGT CCTTTTCGAT TTACCCGACA 
CGCGCAACAA ATAGGTACCT TCTCTGACGC AACAGATTGA AAAGGTACAA AAGTCCAAAC 
GGGAACATTC CGGCTCGGCG GCGCAGGGGT CGCCGGTTCG TGCTCCCTCT GCCGCCAAAC 
TGCGTCGAAC GCTCAAGGGA CATTTCGGTA GAATTGCTGC ATTGCACTGG GGCGGCGATT 
CCAAAACGGT CGTTACGGCG GGACAAGACG GAAATTTGAT TCTTTGGAAC GCGATTACCA 
GCAACAAGTT GCAGTCAATT GGTCTCAAGT CTTCCTACGT CATGGCGGTT GGTATCGAGC 
AAACTAGAGG CAATTTGGTA GCCTGCGGAG GACTCGATAA TCTTTGTACG ATTTTCCCCC 
GCAATAATGT CGGTAAGGCT GCCGAAATGG CCTCGCATGA CGGTTTTCTT TCCTGCTGCC 
GTTTCTTGAG TGAGCAAGAA ATCATCACGT CGTCGGGTGA CTCGACTTGT ATTTTGTGGG 
ATATCAACAC GCACAAACCC GTTTCACGCT TCGAGGAGCA CACGGCAGAT GCCATGTTCT 
TGTCGCTCCG ACCAAGCGAT CGCAATGTCT TTGTCTCCTG TTCAGTGGAT CAAACTTGCA 
AGGTGTGGGA CACTCGAGCC CCTACCAGTT CGACTTTGAC GTTCACTGGA CACACAGGTG 
ACGTCAATGG AGTAGAATTC CTACCATCGG ACAACAATTG TTTCGCCTCT TGTAGTGAAG 
ATAACACCGT CCGTATCTTT GATATTAGGG CCAGCGATGA ACTCGCAAAA TTCCAAGGGC 
CAGCGAGCTT GGGGTCCTCG GCGGTTAACG GCAGTGGAGG TTTCAGTGAG TCTCCATCGG 
ATGGATTGAC ATCTTTGGCC GTGAGCAAAT CGGGCCGACT GGTTTTCTGC GGTGACTCGG 
AGGGCAACTT CTCGTGCTTT GACATTTTGT CGGAACGATC TGGACCAGCT TACACGAATA 
CAGGTGCGCA CGATCGATAC ATCTCGTGCA TCGGCATCAG TCCCCACGAG GACGCGATTT 
GCACCGGAAG TTGGGACACT CAAGCCAAAG TCTGGGCTTA G

Protein sequence

MSTSEIQQDT AREEVPSLTQ QIEKVQKSKR EHSGSAAQGS PVRAPSAAKL RRTLKGHFGR 
IAALHWGGDS KTVVTAGQDG NLILWNAITS NKLQSIGLKS SYVMAVGIEQ TRGNLVACGG 
LDNLCTIFPR NNVGKAAEMA SHDGFLSCCR FLSEQEIITS SGDSTCILWD INTHKPVSRF 
EEHTADAMFL SLRPSDRNVF VSCSVDQTCK VWDTRAPTSS TLTFTGHTGD VNGVEFLPSD 
NNCFASCSED NTVRIFDIRA SDELAKFQGP ASLGESPSDG LTSLAVSKSG RLVFCGDSEG 
NFSCFDILSE RSGPAYTNTG AHDRYISCIG ISPHEDAICT GSWDTQAKVW A