Gene PHATRDRAFT_19089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_19089
Symbol	GEL3
ID	7197808
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011672
Strand	-
Start bp	932064
End bp	933474
Gene Length	1411 bp
Protein Length	373 aa
Translation table
GC content	50%
IMG OID
Product	gelosin/severin like protein
Protein accession	XP_002178606
Protein GI	219115621
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TGCGAGACAA AAGCCTGGCA CCGGATCCAA CAGGCTCACA ATCACAACCC GTTCGCACAA 
GCAGTCCCGC GAACGAAAGA ACAAGTTCCG TCATGAGCCA ACGTGTCCCC TGGAAGGAAT 
CTAACCTGGC CTTGATTGGT AGTGACCTGG ATCACAAGAT CAAAGCGGCT GCTGCTGAGA 
ATGAAGAGCA GTGGCAGGGT CTGAACGAAG CGCCGGGCAG AAAAGTCTGG CGCATCGAAC 
AGTTCAAGGT AGTCCCTTGG CCCGAGGATC AGTACGGAAA ATTTCACAAG GGAGATTCTT 
ACGTTGTTTT GAACTCTTAT ACTGAGGACG GGAGTGATGC ACTCTTGCAC GATATACATA 
TTTGGATTGG CTCTGAATCT TCGCAGGACG AGTACGGAAC GGCCGCTTAC AAGATGGTCG 
AAGCCGATGA TTCGTTGGGT GGCGCCGCTA TCCAGCATCG AGAGGTTCAA GGCAAGGAGA 
GCCCGGTAAG CATCCCATCC AACGATTGCA GTGCCAATTC GCACTCTGTA AGCATCTATA 
TTCCCTAGCT CAACAACCTC TTGTTCTTTT TCTCGCGATC GCAGCTTTTT CAGTCCTACT 
TTGAGGAATT GACTTATCTA GAAGGTGGTG CCGACACCGG ATTTAATGTC GTCGAGCCCA 
CGAAGGACAA GCCGCATTTG TACCGGGTGA AGGGCACGGA AAAGGGAATG TCGCTCACCC 
AGCTGTCTCT CTCCAAGTCG TCTCTGAATA CCGGAGATTC CTTTATTCTA TTCGCCAACG 
GAAGCAACGT TTGGCTTTGG AACGGCGAGT CTGCTAACCC CGACGAAAAG GCCCGCGCGA 
ACTCATTGGC TGAGAGCATG TGTACGCAGG GAACAGTCAA AGTTTTGGAT CAAGGTCAGG 
GCGACGAAGA AGAGACCGAC TTTTGGGATT ACCTTGGTGA TGGCGAAATT CAAGAAGCCG 
ATGATGGAGA TGAAGAGGTT GATGAGTTTA TTCCTCTCTT GTTCAAGCTC TCGGATAACC 
CGGACGAAGA ACCTGAGCAG GTTGCGGAGG GTGAACCTGT GAAAGTTCGT TGGGGTAGTC 
CTTCACCCAA GATAGATCGC TCCTTTCTGA ATGAGAACGA TGTATTTTTG CTCGACGCCG 
GTTGGGAAAT TTTTGTTTGG ATCGGTACCG ATGCAGACCG CAGTGAGAAG CTTATGGCCA 
TGGGCAAGGC GGATAGTTTT TGCAAACAGG ATCCTCGTAA GGCCGACCTC CCCGTCTCCA 
TTGTGAAGAG CGGTTGGGAA AGCTCTGGAT TCAAGGCTTT CTTCAGCGAA TAGACGGTTG 
GACTGGCAAC GATTGTTGCG AGAGATCTAG AATGTAGCTG ACTGACAGAG AATATGAGAT 
AATATTTCAG AAATTTCCGT ATTACAATTA C

Protein sequence

MSQRVPWKES NLALIGSDLD HKIKAAAAEN EEQWQGLNEA PGRKVWRIEQ FKVVPWPEDQ 
YGKFHKGDSY VVLNSYTEDG SDALLHDIHI WIGSESSQDE YGTAAYKMVE ADDSLGGAAI 
QHREVQGKES PLFQSYFEEL TYLEGGADTG FNVVEPTKDK PHLYRVKGTE KGMSLTQLSL 
SKSSLNTGDS FILFANGSNV WLWNGESANP DEKARANSLA ESMCTQGTVK VLDQGQGDEE 
ETDFWDYLGD GEIQEADDGD EEVDEFIPLL FKLSDNPDEE PEQVAEGEPV KVRWGSPSPK 
IDRSFLNEND VFLLDAGWEI FVWIGTDADR SEKLMAMGKA DSFCKQDPRK ADLPVSIVKS 
GWESSGFKAF FSE