Gene PHATRDRAFT_32550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_32550
Symbol
ID	7197103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011670
Strand	-
Start bp	216441
End bp	217622
Gene Length	1182 bp
Protein Length	393 aa
Translation table
GC content	50%
IMG OID
Product	predicted protein
Protein accession	XP_002177886
Protein GI	219112269
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGCATGG GATCAACCTT AACAAAATCG AACAAAGGCA TTGCGGATGA AAAGGCTAGA 
AAGGCTTCAC CGGCCAAGGC TTACGCTGAT CTCGCCAAGG CCAAGCTTTC CGGTCTGGTG 
GTCGCCACTA CTGCAGCCGG ATTTGTCGCG ACAGGCGGTC CACTTTCAAC CCAGCTAGAC 
GTTTTCACAG CATGCGTTGT TGGCACAGCC CTATGCTCCT CATCAGCTGC AGCTTGGAAT 
CAAATTTTGG AGATTCCTCG GGATGAAAAA ATGAAGCGAA CCCAACAACG ACCACTGATT 
ACTGGTGCGC TCACACTGTC GAAAGCGAAA TCGGCTGCCG TGGTCTGGGG TGCTTCGGGT 
GCAGCCTTGC TGGCAGCGGG GACTGATCCC GTTACTACCA CGTTAGGCGT TGGCAATATT 
GCGCTCTACG CCGGGTTGTA CACGTACATG AAGCCTCGGT CCATCTACAA TACGTGGGTG 
GGTGCTGTTG TAGGAGCAAT ACCTCCGGTA ATGGGCTGGA CCGCGGCGAC AGGAGGATCC 
ATTATGGATA TGGAAGCTTT GATGCTCGGA GGCATATTGT ATCTGTGGCA AATGCCACAC 
TTTTTTGCGT TGTCCTACAT GTACCGGGAA GATTACAAAC GTGGTGGTTT CCAAATGGTA 
CCGTGTTTGG AAGCGGATGG TGTCCAAACA GCGAACATAG TTGTCCGATA CGCCTGGTAT 
TTGAGTGCTG TCCCGTTTGT ATGCGCTTTG ACGAGCGTGA CAAGCAGTAT GTTTGCTTTG 
GAAGGCGTTG CGTTGAACGC TTACGCCTTA ACGGTGGCGC ATAAGTTCAA ACGGGAGCGC 
ACGAACGCTA ACGCACGCAA AATATTTTTG ACATCCCTCT GGTATCTACC ATCCTTACTA 
ATGCTGTTTT TGCTACACTC CAAAACCTGG GATGATGAGG AAGAAAAGAC CAAGGATCCA 
ATCGCTAATT TCTTGTTTAC GCAGATTCAT TCTATTCGCG ACAAAGGAAG GGACTTGTGC 
GTTCACGAAC AAGTAGTGGC AACTCATTCC GATGGCAAAG AAGCATGCCC AGTCACCGTT 
GCGGCTAAAC AAACCAGAAA GGGAGTGCAA AAAGTAAAGT CGACTGCGGA TTCAGCGACC 
GATGCTATTC AGGAGAAGTC CACAAAGAGT AGAGAAACGT AA

Protein sequence

MGMGSTLTKS NKGIADEKAR KASPAKAYAD LAKAKLSGLV VATTAAGFVA TGGPLSTQLD 
VFTACVVGTA LCSSSAAAWN QILEIPRDEK MKRTQQRPLI TGALTLSKAK SAAVVWGASG 
AALLAAGTDP VTTTLGVGNI ALYAGLYTYM KPRSIYNTWV GAVVGAIPPV MGWTAATGGS 
IMDMEALMLG GILYLWQMPH FFALSYMYRE DYKRGGFQMV PCLEADGVQT ANIVVRYAWY 
LSAVPFVCAL TSVTSSMFAL EGVALNAYAL TVAHKFKRER TNANARKIFL TSLWYLPSLL 
MLFLLHSKTW DDEEEKTKDP IANFLFTQIH SIRDKGRDLC VHEQVVATHS DGKEACPVTV 
AAKQTRKGVQ KVKSTADSAT DAIQEKSTKS RET