Gene PHATRDRAFT_47699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47699
Symbol
ID	7202706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	-
Start bp	569189
End bp	570379
Gene Length	1191 bp
Protein Length	231 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002182089
Protein GI	219123557
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CTCGAAAGGC GGGATTTGGC GGGTTCGCTT CGTTCGGTTC GCATAGTCGA TGTTCCAGGA 
TGCTTCGTCT TCCTTTCTAC GAACGCTCGA TAGGCAAACA CTGACATTTT ATGAATAAAT 
GGGTGCCTCG TTAACTATAC TGTTCGAGAG CACGACACTT GCAGTTAGTC CAGTCTGTGA 
AGCCGGTATT TCTCTAGCGT ACCTTGAATA CGAACACCAT TCAAAAATGC CATCCACATT 
CTCAAAACAT CAACACAAAC CATTTTTGCA AGAAAAGGTG TGCATGTAAA TATACTGTCA 
CACGTATCGC CCTTCACAAT GAATGACGGA TTGAGCACAA CAATCGTACT CCAAGATAAT 
GAAACTACAA CAAAACCACC CACAACTGCC GAAGGCGGTA TCGGGAATGA TGCAACGGAC 
GCGGCAACTT TGGTTCTTGT CGTCTTTCTG ATAGGCTTCT GCATGATAAT CTGTCGAATG 
GCCTTGCTAC GACAAAACGC CACAGATCAA CATGACCAAC AAGTCGAATC CAAACAGACA 
CAGAAAAAGA GAATCGCGGA ACGCAAAGAG TACATTGCTT CGAACATGAT GGTGCGAGAA 
TGGAAAAGTG CTGCTATCAG CGATGATTCG ATGACGAGTG CGTCCGACGA CTTGACTTTA 
GAATATGGGG ATGAGACCGA CAATGTTCCT ACCGGATTAA GACCTTCGTC AACGAGCGGC 
GACTCTGTTA ATCGAAAGGA GCAACTTGAA AACTCCGACT CCCATTCACG AATAAAGGGA 
GATGACTTTC CCAGCTATCG CGAATGCACT CCTACGGCCG CGTTGAGTGA CTATGATTCC 
TTTTGTGAAG ACACCGGGTG CGCCATTTGC CTTTCAAATT ACGAACCATG CGACCGCGTC 
TGCGAGTCAG TCTCGTGCAA GCACATCTTT CATGAAGCTT GCATGTCCGC TTGGCTCATC 
AAGCACGATC GGTGCCCAAT TTGTCGCGAG CCCTATTTGG TAGAAACGGC GTGAAGAACG 
AACGTATCAT AAATCGGACC CAGCGTGATT CCGGATAGAA GCGAAAGCCG AATCGGCGTT 
TTTGGTGTTT GGTTATGGTG ACGCTCCCTC TGTGACCAGG AGCGGCAATC CCCATTAGAG 
ACAAACCGCC TTCGCTGTTA ACAGAAATAT AAATCCTAGG GTACACTTCA C

Protein sequence

MNDGLSTTIV LQDNETTTKP PTTAEGGIGN DATDAATLVL VVFLIGFCMI ICRMALLRQN 
ATDQHDQQVE SKQTQKKRIA ERKEYIASNM MVREWKSAAI SDDSMTSASD DLTLEYGDET 
DNVPTGLRPS STSGDSVNRK EQLENSDSHS RIKGDDFPSY RECTPTAALS DYDSFCEDTG 
CAICLSNYEP CDRVCESVSC KHIFHEACMS AWLIKHDRCP ICREPYLVET A