Gene PHATRDRAFT_36531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_36531
Symbol
ID	7201693
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011678
Strand	+
Start bp	681001
End bp	682299
Gene Length	1299 bp
Protein Length	432 aa
Translation table
GC content	50%
IMG OID
Product	type II DNA topoisomerase VI subunit
Protein accession	XP_002180881
Protein GI	219120278
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGGACC TTATCGAGAG CGGCGTCGTC GAAGATGGAA CCAATCAAGG CCGGTACGCC 
GTCATTGATG CGACTTTGGA AATTCCCGGA CGAGCACTAT CCGTCACGCA AACACCAGTC 
TACGGCCGAC ATGATCATCT GACATCCGAC GAAGTAATCG CTCGCATCGA GCGCTTGATT 
GAGACAGTGG TTTTGGCACT AGAGAGAGGT AGAATGCCCA TCCTCGAGAC GTTGTGGATC 
CCTTTGGAAA ATGGGAGCGG CGGCGAAGAC GCGGTTTTGG GTGCGCAGCA AGGCGACATT 
TTACGCAAGA CCTTTCACTT GCATCAGTGT CGATCGTTTA CTAGTATTTT ACTTGTTCTA 
GACTTCTGTC ACTCTCTGCT ACGTGCTCGG CGTACAACAA CAACCCGTGA AGTTTACTAC 
TACCACGTGA CGCACTACCG CTCCCAAAAA GAATGCGATT CCGCCATTCA GGATACCGCA 
ATATTACTTC AGGTTCCACG CAGCAGTCTT GGTTTAAAAG CCTCACCAAA AGGATGGTTT 
TGTGGAGATG TCCAGCTGGT GTCGAACGGT CAGGTTGTCT TGGACGGACG GCATTTGCAA 
TCTATTCACG GTGCCCCCAT TAGTGGCGAA TGGCTCGCCC CTACTCGCGA CTTTACAATT 
CATTCGTGCG CCGCCACATG TATCCTGGTC ATTGAAAAGG AAGGCGTGTA CAATCGTTTG 
GTGGAGGATC GTTTTTTCGA TCGATTTCCT TGCATCTTGG TCACGGGCAA GGGTTTTCCA 
GATTTGTCAA CCAGGGCCCT CGTCCACGTG CTGCACCACA CATTGGGGCT TCTACCCGTC 
CGTGGACTCT GTGATTGCAA TCCATACGGT GTCATGGTCT TGCATACGTA TCAACATACC 
GCGCGGAAAG GTGTGGATGG TGGACACCGT TTTGGGGTTC CAATATCGTG GATTGGTTTG 
CGACCATCGC AAGTTCAACA GCTTCAGCGG CAGCCCAACA CCAAACATGG TCAGTCCAAA 
CTGCCGGATC AAGTTTTTCA AAGCCTGACA GCTCTCGATA AGCGACGCTT AGAACATCAC 
TTGTTGAGTG AGCAACATGG CTGGACAACA TTCGGACCAG ATGAGCGACG GGTGGAAGAG 
TTGGAGGAAA TGCTGAAGAA CGGCTACAAG ATGGAATTGG AAGCTTTGAA CTGGTTGGGA 
ATGGACTTTA TCACAAAGTG GCTTGGTGAT ATCTTTCATT ATCAAGACAG AGCGGGACAC 
GGGCATGAAG GGAACAGTTG TTGGATGGAT ATTATTTGA

Protein sequence

MEDLIESGVV EDGTNQGRYA VIDATLEIPG RALSVTQTPV YGRHDHLTSD EVIARIERLI 
ETVVLALERG RMPILETLWI PLENGSGGED AVLGAQQGDI LRKTFHLHQC RSFTSILLVL 
DFCHSLLRAR RTTTTREVYY YHVTHYRSQK ECDSAIQDTA ILLQVPRSSL GLKASPKGWF 
CGDVQLVSNG QVVLDGRHLQ SIHGAPISGE WLAPTRDFTI HSCAATCILV IEKEGVYNRL 
VEDRFFDRFP CILVTGKGFP DLSTRALVHV LHHTLGLLPV RGLCDCNPYG VMVLHTYQHT 
ARKGVDGGHR FGVPISWIGL RPSQVQQLQR QPNTKHGQSK LPDQVFQSLT ALDKRRLEHH 
LLSEQHGWTT FGPDERRVEE LEEMLKNGYK MELEALNWLG MDFITKWLGD IFHYQDRAGH 
GHEGNSCWMD II