Gene PHATRDRAFT_40163 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_40163
Symbol
ID	7195933
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011690
Strand	+
Start bp	293625
End bp	294816
Gene Length	1192 bp
Protein Length	371 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002184106
Protein GI	219127779
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.258243
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGACGGTG CCTTTGATCT GCTTCACTAC GGACATATGA ATGCGTTTCG TCTTGGTCGT 
TCACTTGGAA CACACCTGGT GGTCGGAGTC AACTCGGACG AGTCTATCAG CCAATGCAAA 
GGGCCTCCCC TCATGAACGA CGAGGAACGG ATGACCATGG TTAGTGCTTG CAAGTTTGTC 
GACGAAATCT TGCCCAATTG TCCATACATT ATGAATCGCG AATATTTAGA CTACGTTATT 
GAAACGTACA AGATCGATTA CGTCATTCAT GGTGACGACC CGTGCATCGT GGACGGTAAA 
GATGTATATG CCGCCGCCAA GGAAGCCGGA AAGTACAGGG GAATTCCACG AACGGAAGGA 
GTTTCCACTA CCGACATTGT CGGCCGTATG CTCCTCATGA CCAAGGAACA CCACTATCAC 
AACGAGACTT CCTCGATCGA CGAACGAGAC GATGAGGTGC CAAAATCTCC TGGAAGTTCG 
CGGGAGTGGC TCGGGCGACA ATCCAAATTT TTGACGACTA GTCGTATGCT GCAATTATTC 
AGTGCCGACG TACAGGCACC CACACCACAC ATGCGGGTTG TTTACATCGA TGGAGCCTGG 
GACTTATTTC ACCCTGGCCA CGTGGCGATC CTGAGAGCTG CTCGTGAAGT AAGAAAGCCT 
GAGTGCTGTT TTTGTGTTGC CGAATCATCC CGTTACTAAC CGATGCCTTT TTTTGGAACC 
GTAGCGTGGT GATTATCTAA TTGTCGGTAT TCACGGTGAT GCCACCGTCA ATCGCGTTCG 
GGGAATGAAC TTGCCACTCA TGAATTTGCA TGAACGCGTA CTCAGTGTTT TGGGTTGCCG 
ATTCGCTGAC GACGTTCTGA TTGACGCACC GTATGATGTC TCCATGGAAA TGATTGCCTC 
ACTTAATATT TCGGAAGTCG TCGGTACCAA CGATCACGAC ATTGGTGAAT TTGAGATGAA 
ATCACAGACG CATCGGTACC GGCATGCGGA ACAAGCTGGG TTATTGCATT TGATGGACAT 
TCCGAGCAAA TTTAACATGG GACGAATTGT GGAACGCATC CAACGCAATC AGGAAGCCTA 
CCAAGCCAAA TTTGAACGGA AAATGGCAGC AGAGCGAGAA TTCTATGAGC AGAAGCGCGC 
CAGTGAATAC GATGCGGCCT TTCATGAAGG AAGAGTAACT TTTGTGAGCT AG

Protein sequence

MDGAFDLLHY GHMNAFRLGR SLGTHLVVGV NSDESISQCK GPPLMNDEER MTMVSACKFV 
DEILPNCPYI MNREYLDYVI ETYKIDYVIH GDDPCIVDGK DVYAAAKEAG KYRGIPRTEG 
VSTTDIVGRM LLMTKEHHYH NETSSIDERD DEVPKSPGSS REWLGRQSKF LTTSRMLQLF 
SADVQAPTPH MRVVYIDGAW DLFHPGHVAI LRAARERGDY LIVGIHGDAT VNRVRGMNLP 
LMNLHERVLS VLGCRFADDV LIDAPYDVSM EMIASLNISE VVGTNDHDIG EFEMKSQTHR 
YRHAEQAGLL HLMDIPSKFN MGRIVERIQR NQEAYQAKFE RKMAAEREFY EQKRASEYDA 
AFHEGRVTFV S