Gene PHATRDRAFT_47894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_47894
Symbol
ID	7203161
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011683
Strand	-
Start bp	373706
End bp	374967
Gene Length	1262 bp
Protein Length	254 aa
Translation table
GC content	47%
IMG OID
Product	predicted protein
Protein accession	XP_002182381
Protein GI	219124166
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGTGGA CAAAGACACT GACATCTTGC TTCACCTATA GGATAGGCAA ATCTTTGTAC 
GTTCCGCTCA CCAGTCGATG CAATAGTCGG ACTCTACCGC TTACCCGGGG TCCCAACTTC 
TTGCTCCCAC CGGAAGTCGT CGTCGCCCTA TGTCGCGTGC GGGATGCTGA AGGAAACGCA 
TCTCAATGGA AACACTGGTG CATATGGTTA GAAACACAAG AACGTAAACA AAAGCTACCG 
GAGCCATCTG ACGATGCTTT TGTCGTGGAG CTTCCTTCAG ACTTTTTATC GGGACGCCCA 
ACAGTAGAAG AACTTCTGAT GGAGATACAG GAAATTAACC TCTCCGAATT TGAATCCATA 
GTGATTGCGG GAGAAGGAGA ACCCACACTG AGATTCAACA TATTATCTAA ATTTGTACAG 
CACGTACAAG AACTGTGTGA TCTACCTGTT CGGCTTTCGA CCAACGGCTT GCTTTCGTCA 
ACCAGAGCAA AGGACTTAGT GGAATGCGGT GTGGACTCGG TTAGCGTCGC ACTCATGACG 
AGCGACGCAG ACCAGTACGA TAACCTGATG AATCCGCAGT TGCCTTCCGA ATGCTCGTCG 
AGGGCACATC AAATGCTGTG TGATTTCGTG ATTGCCGCAC AAAAAGCTGG GCTTCAGGTT 
GAACTTACGG CGATCGATCG GCCCGAAGTT GACCGTGAAC AAACACAGGC GCTGTCAACA 
CGATTAGCTG GTGTGGATGT TCGATGGCGG TCATACTTCC CGTAGAACAC TTTTTATCGT 
TATTTGTATT TTTAAAGGTA CGAATATGCT ATGTAGATTA TAGCAACAGT GACGATCATA 
TAAAGTGCTT TTACCATCAT TCGAAAGCAA TGCTGATGCC GCTTCGTATA TTTCCACGCA 
ACGAACACAC TTCCTCATCT CCATTCTCTG TGTCCTATGT TTTCCCGGCG GCGAATCATG 
CCCTGATAAA TCAAAACGAC GTTGCCTTGC TGGAATGTGA CACAGATGTT ACGCTTCAGT 
TGCATTGCAT TCTTTCTTCG CCACTGGCGC AATTTCTGTA TCTATTGTTG CCATTGAATT 
TTGGTTCGCA CCCTGCACAA GCATTTTTTC CGTGGTAACC CAAGTTTCTT CTTTTATGAT 
TTTGTGCTTT TTCTGCAACT GCCCTACGCG ACCTGGATTC GACAGATTCT CGTCCCTCAC 
TGTCAGCTGT AGTCACCCCT GTCATGGGTA GCAGTGGTAA ATGTATGTCG TTATCGTGTG 
GC

Protein sequence

MKWTKTLTSC FTYRIGKSLY VPLTSRCNSR TLPLTRGPNF LLPPEVVVAL CRVRDAEGNA 
SQWKHWCIWL ETQERKQKLP EPSDDAFVVE LPSDFLSGRP TVEELLMEIQ EINLSEFESI 
VIAGEGEPTL RFNILSKFVQ HVQELCDLPV RLSTNGLLSS TRAKDLVECG VDSVSVALMT 
SDADQYDNLM NPQLPSECSS RAHQMLCDFV IAAQKAGLQV ELTAIDRPEV DREQTQALST 
RLAGVDVRWR SYFP