Gene PHATRDRAFT_48702 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_48702
Symbol
ID	7194686
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011686
Strand	-
Start bp	673333
End bp	674582
Gene Length	1250 bp
Protein Length	398 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002183264
Protein GI	219126017
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGATTCTGTT TGACGCTGAA CAATTCCCTA CTTGTTGAGC CAAACAGTAC ACTATGAGCA 
ATAATAGGAC CGGCCCACTC AGTTTAAACG ATTTAGTTGC ATTGCTGAAC AGCGGATCTC 
CAATCGATGG CTTGGCAAAC ATATTGAGAG GATCTGCGCC GACTTCTCCG TACGCGGCTA 
CGGCGCCACC GATCGCCAGA GCTATGGCCG ATGCCACCAT TGGCACCTCT CCCGTCAGCC 
GGCTGTGGCA TCAGCTTACC AATCTTAATA ATATTTCCAC TACTGCTAGC CATGGAGGGG 
GTCTGAATGC TGAAGAGGCT CTGCGGATAC TGCTGGGGGT TCAAGGGCAA ACGCCGATGC 
AGTGTCCAAA TCTGGAAACG GGGGCGCCTG CATTGCAACA GCAATACGCG CATCTCCCAG 
CTGTACACAC TGTTCCTCCT TCCGACTCTA ATCTCAGCGC ACAAAAGCTG ATAGACCTTT 
TGATTCGACA ACAGCTTCTC ACTCAGACAC ATCAAACAAC CGCGCCTATC GGTGCTGGCA 
ACGTGGGGGT CCAGGCTCCG TTCGCCGTTG CGCCATACGC CCCTCCACCG CAGCAGTTAA 
ACCCAGACCA AGCCGCGGTG ATCGCCCAGC TATTACGCAA CAACCATCAG TCTGCGGCAC 
CGCAACTGCC AGAAGTACCG CAGGCTTTCT TGGAAGCGCG GAAACCCCCG GCAGTGGGTA 
ATCTTCCACA TTGGCGAGTA GCGACACACG AGGCCGTACT CAACCAGAAT ACAGCCCCCC 
TTACCACTGA TCTACGGCTT GCAACCAAAG AAGTCAAACG TCGTAGTGGT CGTAGTGGAA 
GCTTTCCGCA AAAGCTACAC CAGATGCTGA CAGACCTGGA GCAGCAAGGC AGTGACGTAG 
CCTCTTTTTC TTCTCATGGG CGCTCCTTTT CGATACACAA GCCAAAGGAA TTCGTTCGCG 
ATGTTATGCC CAAGTACTGT CGGATGAGTC GATACACCAG CTTTCAGCGC CAGCTTGCCC 
TGTACAACAT TCGTCGCATC ACAGAAGGAC CCAACAAGGG GTCCTATTGT CACGAACTTT 
TCGTTCGAGG TCGGCCGATT CTTGCGACAA TGATCAATCG AAACAAAAGC AAAGCCAGTA 
AGAAGGTCCA AGTCAGCTCT GAGTCTGGCA ATACTGAAAC CCAAGAAGAA AATGACGAGG 
AAGCCAGTCT GACTAGTATG AACGAAAATG GCCAGGACGG TGAAATGTAG

Protein sequence

MSNNRTGPLS LNDLVALLNS GSPIDGLANI LRGSAPTSPY AATAPPIARA MADATIGTSP 
VSRLWHQLTN LNNISTTASH GGGLNAEEAL RILLGVQGQT PMQCPNLETG APALQQQYAH 
LPAVHTVPPS DSNLSAQKLI DLLIRQQLLT QTHQTTAPIG AGNVGVQAPF AVAPYAPPPQ 
QLNPDQAAVI AQLLRNNHQS AAPQLPEVPQ AFLEARKPPA VGNLPHWRVA THEAVLNQNT 
APLTTDLRLA TKEVKRRSGR SGSFPQKLHQ MLTDLEQQGS DVASFSSHGR SFSIHKPKEF 
VRDVMPKYCR MSRYTSFQRQ LALYNIRRIT EGPNKGSYCH ELFVRGRPIL ATMINRNKSK 
ASKKVQVSSE SGNTETQEEN DEEASLTSMN ENGQDGEM