Gene PHATRDRAFT_50388 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_50388
Symbol
ID	7199202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011697
Strand	+
Start bp	198158
End bp	199487
Gene Length	1330 bp
Protein Length	354 aa
Translation table
GC content	57%
IMG OID
Product	predicted protein
Protein accession	XP_002185291
Protein GI	219130269
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTCACTAAAT GTTTGATAGT GCGCCACGAA GGAATATTAT ACCGCGATTC ATACGTTGAT 
CCATTGATAC ATCCATCCTT TCTTCCACAC TTTCTTGTCA CCTTTGCAGG TATTAGCGCA 
CCCCCGAATT CCATCCGTAG TGCTAGCAGC GTGCGCTGGT GTGTGCTGGT TGAACCTGCA 
CCGACTCGCA AACAATTCGG CTTTTGTACT AAAGTCCGTC GCCGAAAATG TCGTCTGCTT 
CCGATCCACA AGGCTGGGTG ACGAATCCAC CATCCGTGCT CGTCAAGGTA CGAGATATTA 
CCGCCAAACC CCACTTGAAC GGCGAGCTCG GGGTCGTCGT CGGCTACCTT CCGGACCGCA 
CGCGCTACGT CGTCGTCACC TGTCGCCAGC AGGAACAGCT GTCGCTCAAG CCGGAGAATC 
TTCACAAGGC CAACTTCCTC GAACAAGCCA AAGGACAATA CCAGCTCCTC ACGAATGATC 
CTCGTGTGCG ACGACAATTG CAGCAAGTTT ATCATCGCGT ACAGACAAAA CTGCCGGCCC 
CGTTGCAACC GGAACACGTT GCGGTCGTCT TGCTCCTCCT TATTCTAGCC AGCGGATACT 
TTCTGGGTGT CAGCAAAACA CTCATGATCG TCTCTCTTTT ACTCGGCCTA GCCACTCTGG 
CGGGTCCGGA AATTGCGGCG GGCAAGAGTT GGGAACAAAT TGGGCGGGAC TTGCCGCGTA 
GGGCCACGAG CACCTTGCAA GACACCATCC GACAGAGCGT TCCCTACGTC GGACCCAAGT 
TGGCCGATAC GCCTTACGTC GTCCCCGCAC TTCTCGGTAT CCTGCTCGCC GGGACCGTCA 
AGGTGTTACT TCTACCGGCT CAACCCCGCG TGCCCTTGGA GACGGCGGCC ACGGCGTTGC 
GGACGGAACC CGGGGCGCCC AGGCGTGGCG GGGCCCTACC GGACGCGGAA GAACTCTACA 
AGCTAGGGTT CGACGACGCC ACCAGTAATT TGGCCTTTGG GACGTCGTTG TCACCCCCAT 
CCGTGGTGCC GGACGACTTT CTCGTCAACG ATGACTACAG CGATATGCCG TCCTTGACGA 
CGAATACGCG GGTATCCCCG TGGAACTGGA GTACGCTCAT GAGTGTTTTC TATCTCGGAC 
GGACCGTGTA TGCCTTGGGC TGGGATCCGG TACAGGGCGC ATGGAGTTGG GGACGTGCCA 
AGGCCAATTT GGTGACCCAG CCTACCTATC AATCCGCCTT TTTGGCCTTG TCCGTCTATC 
GGGTTGTCAG TGCCATAGCG GCTTCGCGGT AATGGCTTAC GACCTGGACG ACACCGTGAC 
ATGAAAGGAG

Protein sequence

MSSASDPQGW VTNPPSVLVK VRDITAKPHL NGELGVVVGY LPDRTRYVVV TCRQQEQLSL 
KPENLHKANF LEQAKGQYQL LTNDPRVRRQ LQQVYHRVQT KLPAPLQPEH VAVVLLLLIL 
ASGYFLGVSK TLMIVSLLLG LATLAGPEIA AGKSWEQIGR DLPRRATSTL QDTIRQSVPY 
VGPKLADTPY VVPALLGILL AGTVKVLLLP AQPRVPLETA ATALRTEPGA PRRGGALPDA 
EELYKLGFDD ATSNLAFGTS LSPPSVVPDD FLVNDDYSDM PSLTTNTRVS PWNWSTLMSV 
FYLGRTVYAL GWDPVQGAWS WGRAKANLVT QPTYQSAFLA LSVYRVVSAI AASR