Gene PHATRDRAFT_16222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_16222
Symbol
ID	7198349
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011692
Strand	-
Start bp	233294
End bp	234856
Gene Length	1563 bp
Protein Length	521 aa
Translation table
GC content	51%
IMG OID
Product	predicted protein
Protein accession	XP_002184587
Protein GI	219128788
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATGTTG TTGGGACCCT TTTACCGCCC TTGCTGCCAA CAGTTTTTAC CGTTTCAGTC 
GGAATTTCTG ATCAGCGTTT GAGCAAAAAA AGGATTGCGT GTTCCAACTC CGAAGATATT 
TTGGTTGCGG GAAAGGTCCA AACGGCATGC TTTGACAAGA CTGGGACGCT TACAAAACAA 
GGTCTCGATT TCGTGTCCGC GCAGTGCATA CCAACATGGA ATGATCCTCA TTCTCCTTCG 
TCCCCTCTAT CGGATACGGT AGCTCTCGGC ATGGCGTGTT GCCACAGTCT CACGACATCG 
GGTGATGCCA TGATTGGCAA TGCCGTTGAC CGAGTGATGT TCGCTGCGTC GGGGGCACAA 
CAGAATCAGT CCTGGATTGT TCTGAATGGA AACCGAATGA AAGTGCTCAA ACAATTTGAT 
TTTTGCCACA ATCGCATGAC TCAGAGCGTG ATTGTAAAAC GAGTAGACGG CTCCATGCTG 
GCAATTGTCA AGGGTAGTGG AGAGAATGTG CAACGCGCCT GCCTGCCTGC GAGCTTGCCG 
CAGGATTACG AGAGGGTTTT GAGAGAAAGC GCAAAGGCTG GTATATACCA GATTTCAATG 
GCTGCCAAAG TCCTGTCCCC GGCCACGAAC TTGGAAGATA TCCAACGCGA CAAAGTAGAG 
CTTAATATGG AATTCGCCGG TGTGATAAAC TTTCAGAACG TGCTCCGTGA GGAAACACCG 
TATGTGATCA CTCAGCTTCA GGCAGCAGCT GTTGAATGCC TCATTGTAAC CGGGGACGCG 
GTTCTAACAG GCATCACTAT TGCGAGGGAG AGCGGTATCA TCCCTACGGG AGCGGCAGTA 
TTATGGTGCG CTATGCCCCA CAAGGACGAC CGTGTCGAAT GGGTCGATTT CGATCATGAA 
GGGCGCATGA CGGATTTGCC ATGGTCAGCT TTACGCTCGG GGACGACGGT GTTGGCAGTC 
ACGGGTGATG TCTGGGACTC CCTCGATATC TCATTTGTGT CGGAGCTGAG TCCGTTTGTC 
CGCGTTTTTG GAAGGTGCAC ACCCGCACAC AAGGTCGCGA TCATCTCGCA TTATTGCGAT 
CAAGGCAAGA TCACGCTCAT GTGTGGCGAT GGAGGCAACG ACTGTGGAGC GCTCAAGGCT 
GCACACGTGG GTGTGGCTCT TAGCGATGCG GAGGCCAGTA TGGTGTCCCC TTTCACCAGT 
TTGGACAAGT CAATTGTGTC GGTGACGGAG ATCCTCAAGG AAGGACGGTG TGCTTTGGCG 
TCGGCACTGG CCTCGTACAA GTATGTGATA ATGTATGGTC AAGTAGAAGC AATCGCAAAC 
GTCATGAATG CATACTTCAT GATAAACCTA TCAGAGTATT GTTGGATGTT CATGGACGGT 
TTCTGGGTCA TTTCAATGTC TTTCACTTTG CCGCTCGGCA AAGCCGCTTC CGCTTTGGCC 
GAAACTAGGC CTACCGCGTC CCTCCTTGGT CCCATTACTG CCTCGAGCGT CGTCGGTATT 
CTTCTTATCA ACACTACTTT TGCAATTATT GCTCTCTGGA TTCTATTTCA TCAAGATTGG 
TTC

Protein sequence

MYVVGTLLPP LLPTVFTVSV GISDQRLSKK RIACSNSEDI LVAGKVQTAC FDKTGTLTKQ 
GLDFVSAQCI PTWNDPHSPS SPLSDTVALG MACCHSLTTS GDAMIGNAVD RVMFAASGAQ 
QNQSWIVLNG NRMKVLKQFD FCHNRMTQSV IVKRVDGSML AIVKGSGENV QRACLPASLP 
QDYERVLRES AKAGIYQISM AAKVLSPATN LEDIQRDKVE LNMEFAGVIN FQNVLREETP 
YVITQLQAAA VECLIVTGDA VLTGITIARE SGIIPTGAAV LWCAMPHKDD RVEWVDFDHE 
GRMTDLPWSA LRSGTTVLAV TGDVWDSLDI SFVSELSPFV RVFGRCTPAH KVAIISHYCD 
QGKITLMCGD GGNDCGALKA AHVGVALSDA EASMVSPFTS LDKSIVSVTE ILKEGRCALA 
SALASYKYVI MYGQVEAIAN VMNAYFMINL SEYCWMFMDG FWVISMSFTL PLGKAASALA 
ETRPTASLLG PITASSVVGI LLINTTFAII ALWILFHQDW F