Gene PHATRDRAFT_9020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_9020
Symbol
ID	7196421
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	+
Start bp	1198725
End bp	1199861
Gene Length	1137 bp
Protein Length	364 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002176741
Protein GI	219109977
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GAGCCGGCTT GGCAAGTTGC CTTCTCCAGG GATGGCCGAT ATTTGGCCGT CTGCTACGGA 
GCAATCGAAC CTTGCGTCCG GATTTGGAAG CAGCAGTCGC CCTTTCATGA AGATAGCGGG 
TGGATTCTGG ACGCGACGCT AACGGGCATT CAAACACGGA CGATCCGATC CATCGCATTT 
GCACCCATTC GAACGCCGCT GATCCTAGCC TCAGCATCAT TCGACGGCAC TGTTGCGGTA 
TGGGAACACT ACCCTGCCAC AAATGGAGCA CTAGTCACAG CATCAGCAAA AAGTCCATCA 
GGGGTGGACG AATGGGAGTG TACGGCTCAG TTGGAAGGCC ACGAGAGTGA AGTCAAGTGT 
GTGCAATGGA ATGCCACTGG GTCACTTTTG GCAAGCTGTG GACGCGACAA GACCGTTTGG 
ATCTGGGAAT GCTTTTTGCC TGGTGCTATT GGTGGCCCCA GCGCAGCCCA CCCGTCACCG 
TCAGGCCACA ACTCTGGTGG TGGTGATTTC GAATGCATCG CTGTCCTTCA TGGTCACGAA 
GGTGACGTTA AGTGCGTACA ATTTACAAGT AGTCACGACG AGTGGGGCGA CGGGGACGAG 
ATTTTACTTT CCTCTTCATA CGACAATACT ATCAAGTGCT GGGCCGAAGA CGCCGGTGAT 
TGGTACTGTG CGGCCTCGAT TGAAGACGTT CATTCTTCAA CTATTTGGTC ATTGGCCATG 
TCTCCCAGTG GACTACGGAT GATATCGGGT TCCGACGACC AGAGCCTAGG TATTTATAAA 
TGCTATACAG CTTCCGAGAA GAAGAGACAC TTCCCTGACG AAGGCAAAAA TCGGAACGGC 
CTGTGGAAAT GTGTGGGGCA TCTTCCAGAT GCGCATTTGG CAAGTATATT TTCGGTTGCG 
TACGCTCCGT CACGGGCCGG CCACGGACGG ATAGCAACGG CCGGGGCTGA CAACCGGATA 
CAAATATTCC GAGAGGTGTC TGGTAGCGTT TCTGATCAAC CTCTTTTTAC CGTAGAAACA 
TCGGCTACAA ATGAGCTAGG AGATGTCAAT TGCGTAAGTT GGCACCCTTC AGATGGCTCC 
ATCCTTGCCA CTGCCGGCGA TGACGGATCC GTGTGCATCT GGAAGTTTAA CTTGTAG

Protein sequence

EPAWQVAFSR DGRYLAVCYG AIEPCVRIWK QQSPFHEDSG WILDATLTGI QTRTIRSIAF 
APIRTPLILA SASFDGTVAV WEHYPATNGA LVTASAKSPS GVDEWECTAQ LEGHESEVKC 
VQWNATGSLL ASCGRDKTVW IWECFLPGHN SGGGDFECIA VLHGHEGDVK CVQFTSSHDE 
WGDGDEILLS SSYDNTIKCW AEDAGDWYCA ASIEDVHSST IWSLAMSPSG LRMISGSDDQ 
SLGIYKCYTA SEKKRHFPDE GKNRNGLWKC VGHLPDAHLA SIFSVAYAPS RAGHGRIATA 
GADNRIQIFR EVSGSVSDQP LFTVETSATN ELGDVNCVSW HPSDGSILAT AGDDGSVCIW 
KFNL