Gene PHATRDRAFT_42247 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_42247
Symbol
ID	7195079
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011687
Strand	-
Start bp	356590
End bp	357993
Gene Length	1404 bp
Protein Length	467 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002183471
Protein GI	219126452
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATGGCC CTGTTTCCAT CAAAGGCTGG GTCCGGACCG TGCGGAAGCA AAAGACTCTC 
GCCTTTGTGG AAGTCAACGA CGGCAGTAAC CTTTCCGGCA TTCAGTGCGT GATTGTTTTT 
GATAAAGTCG ACGAAGCGAC CAAGGCGGAA CTCGATAAGG TCACGACCGG ATGTGCGGTG 
GAACTCACCG GCCCATTGGT GGCTAGTCAA GGCGGGAAGC AAGCGGTCGA ATTGGCCGCT 
ACAGTCCTGC GTGTCGTGGG AGCCTGTCCG GCCGAAACTT ACCCGCTCGC CAAGAAACGT 
CACACTCTGG AATATTTGCG ATCGATTGCG CATTTGCGGC CCCGAACAAA TACCATTGCT 
GCGGTAGCTC GAGTACGATC GCATTTGGCC GGCGCGATTC ACGCTTTTTT TCAAACGCAA 
GGGTTCGTGT ACGTGCAGAC GCCTCTCGTG ACAGCTTCGG ATTGTGAAGG AGCCGGCGAA 
CTGTTCCGCG TCACGACGCT CAATCTCGAC AGCGTCTCGA CCTTGCCCAA AGCCAAGAAC 
GAGAACGGCA AAGAGCAGGA TCGAGTCGAT TACAGTGAGG ACTTTTTCGG TAAACCGGCA 
TACTTGACTG TCTCGGGTCA GCTGGGGGGT GAAACACACG CCTGCGCGTT GGGTGATATT 
TACACGTTTG GTCCGACGTT TCGAGCCGAA AATTCCCAAA CGAGTCGCCA TTTGGCCGAA 
TTTCACATGG TCGAACCGGA AATGGCCTTT GCTGATTTGA CTTCCGCCAT GAACAACGCC 
GAAAATATGC TGAAGTACGT AGTACAGCAC GTGTTGGACT CCTGTGGGGA AGATTTGGAG 
TTCTTTCAAA AGTTCTACGA CAAGGCCCTA ATGACGAGAC TGGAAAAACT CGTGCAGAAA 
CCATTTGTTC GCGTTTCTTA CCGGGAAGCG ATCGAGTTTT TGCAGGAAGA GATCAACAAG 
GATCCCAGCA AGTGGCAATT TCCAGACGTA TCCTTTGGTA CCGACTTGGC GACGGAGCAT 
GAACGATGGT TGGCGGAAAC CAAGTTTGAA AGTGCCGTGT TTGTGTACAA CTATCCCAAG 
GCCATCAAAG CCTTCTACAT GCGTGATAAT GAAGAGGACG GCGGGGAAAC GGTCAATGCC 
ATGGACTTGC TTGTTCCCGG CGTCGGAGAA CTGATCGGTG GGAGTCAACG TGAGGAACGG 
TTGGATGTAC TGGAGCAGAA AATTGCCGAC GTTGGGCTTG ATAAGGAAGA CTACTGGTGG 
TACCTGGATT TGCGCCGGTT TGGATCCGTC CCGCACGCCG GGTACGGTCT CGGATTCGAA 
CGGTTGGTGA CCTACGTGTG TGGCATCGAA AACATTCGAG AGGCAATTGC CTTTCCCCGG 
TATCCCGGCA ACGCCGAGTT TTGA

Protein sequence

MDGPVSIKGW VRTVRKQKTL AFVEVNDGSN LSGIQCVIVF DKVDEATKAE LDKVTTGCAV 
ELTGPLVASQ GGKQAVELAA TVLRVVGACP AETYPLAKKR HTLEYLRSIA HLRPRTNTIA 
AVARVRSHLA GAIHAFFQTQ GFVYVQTPLV TASDCEGAGE LFRVTTLNLD SVSTLPKAKN 
ENGKEQDRVD YSEDFFGKPA YLTVSGQLGG ETHACALGDI YTFGPTFRAE NSQTSRHLAE 
FHMVEPEMAF ADLTSAMNNA ENMLKYVVQH VLDSCGEDLE FFQKFYDKAL MTRLEKLVQK 
PFVRVSYREA IEFLQEEINK DPSKWQFPDV SFGTDLATEH ERWLAETKFE SAVFVYNYPK 
AIKAFYMRDN EEDGGETVNA MDLLVPGVGE LIGGSQREER LDVLEQKIAD VGLDKEDYWW 
YLDLRRFGSV PHAGYGLGFE RLVTYVCGIE NIREAIAFPR YPGNAEF