Gene PHATRDRAFT_31518 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_31518
Symbol
ID	7196064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	-
Start bp	272934
End bp	274322
Gene Length	1389 bp
Protein Length	462 aa
Translation table
GC content	49%
IMG OID
Product	predicted protein
Protein accession	XP_002177053
Protein GI	219110603
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGCGT CGACGAAGAA AAAATCCAAG AATGGCCAAC GCACGAAGGC CACCAACAAG 
ACAAAGGTGC GTGAGATATC TCCAGGTACC AAGATCATCG AGGACCTTAC CAGCACCGAT 
GTTTTGTTGG GAAGAGGCAA CGGAGTGGCA GGGTTTGTGG GCAACCAAAA CTTCCGCAAG 
TTGGTCTGGT CGCAAAAAGA TGCCTACGCC AGCGCTTATC GTAACGAAAA GGGGGTTGTT 
GCCGTTAGGG TCATGAGATT GGTTGCTCAA CAAGATCCTC CCGGTCGCTT CGTCGAACGA 
ATTGGTCCCA ATCATTTCTT CGAGGTTGAC GAGTCGAAAG CCTTAGAAAA AACTTGCCAA 
GCCCTTCGTG AGAAGAAAAA CAAGAGACCT CCTGGTTTAA TCATGACACA GCGTCCTCAT 
GTCGTGAAGC CCAAAGAGCT ACGAGCTGCT AGCTGCCCTC AGACGGAAGG AAAGGTCTCG 
ACAAACTCGA AACGAACGAA GCGCTCGACT GTGCGGAAAT CAGGTTCAAA CAAAATTGCG 
GGAAAAGAAA CGAAGGCGAA GCTAGTGAAA AGAAAGACTA CAGGAGCAAA GGTAAAGCTG 
TCTCCGAGGA TTCAAATTAA GGGTATTAGC AAGATAAGTG CTCCTCTACC TCCTCCACAG 
CGGAAGTACC CAGCGAAGTC GCCACGCAAG ACCCCGTACA AGCCGAATGA GACTACTGCG 
AGTATTTCTG AGGGAAGCAC TGGGAAGCAA ATGGAGATAC AATCTCCCAC TGAGCGGACG 
TCTCATCAAG GCACTTGCAC GAACACGAAC CACAATGTTG TCGCAACGAT GCGCACCACG 
TACGAAGGAA CACCCGGCGC GTGCTACAAA CCTCAAGATG CCAATAGTGA CAACGTGATG 
AGTGAACAGG AATGCATTGC CTACACATCC CCCATTGCAA ATACTCTCAA ACGCGGCTCA 
ACGAAGGATA TGGATTACGA GTTTGCTGCT CTTCCCCCAC ACCTGACTGC TTTTTTCAGT 
GGAATTTATT CCAACCATTC CTGTTTTGGG GATGACGGGA CACAGTCAAA AGCTATTGCT 
ATCACACCAA TCTATGAGGC TCCTCCAACC ACCACGTTGC CAGCTACATG GAGTCATCCA 
AGCAATGAAC TTGCTAGCTT CACAAGTTTC TTGTGGGGTA ACGTGGGCAA AAACACCACA 
TCCACATCTG CCCAGAAGTC ATCTTCAGAA TCGCCTCCAA CTGTTGTGGA CTTCGATTTC 
ATAACTCCTC CCAGTTTCGG AGAGCCACAG CAATCCCTCT TGCTTGATGA TATCAATGAC 
GGGACAAGTT TTTGTGACGA GCACTTTCCG TCTCTATCCG AAGAAGATTT TGCTATGTTT 
ATGGTGTAA

Protein sequence

MPASTKKKSK NGQRTKATNK TKVREISPGT KIIEDLTSTD VLLGRGNGVA GFVGNQNFRK 
LVWSQKDAYA SAYRNEKGVV AVRVMRLVAQ QDPPGRFVER IGPNHFFEVD ESKALEKTCQ 
ALREKKNKRP PGLIMTQRPH VVKPKELRAA SCPQTEGKVS TNSKRTKRST VRKSGSNKIA 
GKETKAKLVK RKTTGAKVKL SPRIQIKGIS KISAPLPPPQ RKYPAKSPRK TPYKPNETTA 
SISEGSTGKQ MEIQSPTERT SHQGTCTNTN HNVVATMRTT YEGTPGACYK PQDANSDNVM 
SEQECIAYTS PIANTLKRGS TKDMDYEFAA LPPHLTAFFS GIYSNHSCFG DDGTQSKAIA 
ITPIYEAPPT TTLPATWSHP SNELASFTSF LWGNVGKNTT STSAQKSSSE SPPTVVDFDF 
ITPPSFGEPQ QSLLLDDIND GTSFCDEHFP SLSEEDFAMF MV