Gene PHATRDRAFT_37136 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_37136
Symbol
ID	7202261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011680
Strand	+
Start bp	240666
End bp	241904
Gene Length	1239 bp
Protein Length	412 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002181164
Protein GI	219121627
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTGGAA AGCCCTCTCG CGCGTTCGTT TCCAATTCAA ACGAAATCCG TACCAAAAAT 
ACTGGTATCA TGATCAATAG TCGACACAAA CAAATACAAG TCGCTAACGT TATGCTGAAA 
ATTTCGTCTC CAGAACTCTC TGCATCCCGT GACCCCGAGA CTGGGGATAT CAATCAGTAC 
CAGCGACGAT TGGATCTTCT CAATGATGCT CTCCACTCGT TCAATTCCAC TGCCGCCCAG 
CGTCTTTTAG AGGAGTTGAA TACCATGCGC CAGGAAAATA TTTATCAAGC TGTCATTGAC 
GATGTACTGA ACAATCTACT GGTGCAAGGT CCTGATCAGT CATTGCCATT ATGGGCCAAA 
CTTCGCCCTT TCGCTCGGTA TTCACGGCGA GCGCGCATGG CGAGTCTGCG TCGGACTTTG 
GATTGCACAA CCCCACCACC CAACGTTGAA GACGAGAGTG ATGATGATGC CGCGAGTCAA 
CAAAGACGTC GTCGGCGAGC ACTCATCTCC TTACTTCGTA CCTTGAGTAG TCCCGACGAT 
GACGCCCGTT CAGCCAATGG GAAACCTGCC AGTCCGGCAG TGGTGACGAT TGAGAAACGC 
GCGCGACGCG AACAAAAAGG GGCGAACGGC CAAGACATGA TTGCGCGTCG GCCGACCGAC 
CTGGAAACTC CCGCCTATTC GGTTCTTGCG AAGAAAGCTA ATTTTGAGGT TCGTATGTAC 
AAACCCTTTG CCGTTTGTTC CGTCGCCATG AGCAAACCGC GTCCGGTTGA TGCCTACAAG 
ACGGACGCTA CCGTTGCGGA TCCCAAAATG GGTGGGGCTC GAGCTTTCGG CGCACTTGCT 
GGCTACCTGT TTGGAAAAAA TCAGCAAGAG CAAGCAATGG CTATGACTAC ACCCGTTTTT 
AATACCGGAA GTGATGATGA CAAACAGATG TCATTTGTTC TGCCTTCCGT GTACTGGAAA 
GAAGATGGAA TTTCTGTCGC ACCGCAACCC TTTGTCAATA GCGGAGTCAA ACTGGAACGC 
AATGGAGGAG GTGAAAGAGC GGTTCTTATG TTTGGTGGAT ACGCATCAAA GAATGATGTC 
AAACGCAGAA AACGTGAGCT GCTTGCAAGT CTTGCCAAAG ATAAGGTATG GGAATATCTT 
GAGGACGAGC CGGTGGCACT TGCTCAATAC AACGATCCTT TCACTCCGCC CTGGAAACGT 
TTGAACGAGG TCTCGATTGG CATTCAACTT AGACGCTAA

Protein sequence

MGGKPSRAFV SNSNEIRTKN TGIMINSRHK QIQVANVMLK ISSPELSASR DPETGDINQY 
QRRLDLLNDA LHSFNSTAAQ RLLEELNTMR QENIYQAVID DVLNNLLVQG PDQSLPLWAK 
LRPFARYSRR ARMASLRRTL DCTTPPPNVE DESDDDAASQ QRRRRRALIS LLRTLSSPDD 
DARSANGKPA SPAVVTIEKR ARREQKGANG QDMIARRPTD LETPAYSVLA KKANFEVRMY 
KPFAVCSVAM SKPRPVDAYK TDATVADPKM GGARAFGALA GYLFGKNQQE QAMAMTTPVF 
NTGSDDDKQM SFVLPSVYWK EDGISVAPQP FVNSGVKLER NGGGERAVLM FGGYASKNDV 
KRRKRELLAS LAKDKVWEYL EDEPVALAQY NDPFTPPWKR LNEVSIGIQL RR