Gene PHATRDRAFT_45122 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_45122
Symbol
ID	7200188
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011674
Strand	+
Start bp	265297
End bp	266662
Gene Length	1366 bp
Protein Length	421 aa
Translation table
GC content	52%
IMG OID
Product	predicted protein
Protein accession	XP_002179169
Protein GI	219116749
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GAATCACTGC CGCCGCTCTA GTGCCGTCGA ATAGTGAAAC CATTCGTTTT ACGTTTCAGT 
AAAGAAAGGT TCAGTATGAG TAGCGAAGAC ACGAGCAGTA GCGCTAATAA TTCCGAAGAA 
GCTGTGGCTC CCGCCGAAGC CCCGGCGGAG AATGTGGCTG CGCAACAGGA GAGATCCGAA 
CGCGAGCAAG TGCTCGAGCA GTACAGAGCA AAAATCCGCG AGCATCGTGA GGTGGAAGCC 
CGGTTGAAGC GGATGCGAGA AGATGCGAAA GGTCTGCAAG GGCGTTTCCA AAAGACAGAA 
GACGATTTAA GCGCCTTGCA GTCGGTAGGA ATGATTATTG GGGACGTCTT GAAGCGTCTT 
GATCCTGAAC GATTCATTGT CAAGGCCAGC TCTGGACCAC GCTATGTTGT TGGTTGTAGG 
GCTCGTCTGC AGCACAATCT TCTCAAGCCA GGCACTCGTG TTGCTCTCGA TATGACGACC 
TTGACGATCA TGCGAATTCT CCCTCGCGAG GTGGACCCAA CTGTTTTTCA CATGCAAGCC 
GGCGAAGAAG AAGGTGGCGT TTCCTTTGGC GACATTGGTG GACTCAATGA ACAAATTCGT 
GAGCTCCGGG AGGTCATTGA ACTTCCCCTG ACCAACCCCG AGCTATTTAT CCGTGTTGGA 
ATTAAGGCTC CGAAGGGTGT CTTACTCTAC GGACCTCCCG GAACGGGCAA GACACTTCTG 
GCCCGCGCAC TGGCGTCGAA CATTAGCGCT ACCTTTCTCA AAGTAGTCGC TTCCGCTATT 
GTCGACAAAT ACATCGGCGA ATCCGCCCGT ATTATTCGCG AGATGTTTGG TTTTGCCAGG 
GATCATGAGC CCTGCGTGAT TTTCATGGAC GAAATTGACG CCATTGGTGG TTCCCGTTTC 
TCAGAGGGTA CCTCTGCAGA CCGAGAAATC CAGCGTACGC TGATGGAACT CTTGAACCAA 
ATGGACGGCT TTGAAGAGCA AGGTCAGGTC AAAATGGTCA TGGCCACCAA TCGCCCGGAT 
ATTCTCGATC CAGCCTTGCT GCGTCCCGGC CGCCTCGATC GCAAGATTGA AATCCCAGAA 
CCCAACGAAT CGCAGCGGCT GGAGATTTTA AAAATTCACG CGTCCGGCAT TACCAAAAGG 
GGTGACATTG ACTTTGAATC CGTCGTGAAG CTCGCGGATG GATTGAACGG GGCGGATATG 
CGGAATGTAT GTACCGAAGC GGGATTGTTC GCCATCCGGT CGGATCGAGA TTATGTACTC 
GAAGAAGACT TTATGAAGGC AGCCCGGAAG ATATTGGACA ACAAGAAACT CGAATCCAAA 
CTCGACTATA GCAAAGTGTA AATTGTAAGG CAACTTGCAT AAGTCC

Protein sequence

MSSEDTSSSA NNSEEAVAPA EAPAENVAAQ QERSEREQVL EQYRAKIREH REVEARLKRM 
REDAKGLQGR FQKTEDDLSA LQSVGMIIGD VLKRLDPERF IVKASSGPRY VVGCRARLQH 
NLLKPGTRVA LDMTTLTIMR ILPREVDPTV FHMQAGEEEG GVSFGDIGGL NEQIRELREV 
IELPLTNPEL FIRVGIKAPK GVLLYGPPGT GKTLLARALA SNISATFLKV VASAIVDKYI 
GESARIIREM FGFARDHEPC VIFMDEIDAI GGSRFSEGTS ADREIQRTLM ELLNQMDGFE 
EQGQVKMVMA TNRPDILDPA LLRPGRLDRK IEIPEPNESQ RLEILKIHAS GITKRGDIDF 
ESVVKLADGL NGADMRNVCT EAGLFAIRSD RDYVLEEDFM KAARKILDNK KLESKLDYSK 
V