Gene PHATRDRAFT_21791 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_21791
Symbol
ID	7202836
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	-
Start bp	362958
End bp	364045
Gene Length	1088 bp
Protein Length	208 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002182055
Protein GI	219123487
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0609833
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CGGCTGCCAA CCGGCAAGGT GCAAAAGTGA CTTGAAAAAA CAGACTTGAA AAAGCAAGGC 
GTCCTGTTGG TGTGTCCAAA AATCGAGGTG CTCTGTGTGG GAAACAACCA TTCGTGTATC 
CCGGGTTTGC CTTGAGAGTA CAGCGTTGTT GGAACGGATT CGTTGTTCGC TCGACAACGT 
GCTCCAGCGT TGACAGTTCG TACGAGCTCG TTGACTGTGA ATCGTTGCGA ACGTGAACGT 
CACCTCACGT ACCCTTACGT GTCTTCTGGA TCGGCGTTGC GACACACTGC TACCATGGCC 
GATCAAAAAA TCATGAAGAA ACGGCTCAAG GAGCTCATGA ATCGTCCAGA AAATCAAGTT 
TGCTCGGATT GCCCGGAACG CCAACCCCGT TGGGCGTCAC TCATTGTGCC TCCGCCGGGG 
GCACCCCCGG GGTCGCTCCC CATGGGGGCT TTCTGCTGTT TGGAATGTTC CGGTTCCCAT 
CGACGATTAG GAGTACACAT TTCCTTTGTC CGCTCCATCA ATCTGGATTC TTGTAAGTAC 
CCGAATATCC AAACACGTCT TGTACATACA CACAGAGATT CTTTCGCCTT TCCCGAGTAG 
AGTATTCCGT CTCCACAGTT CATGTCTTGA AATTGTATAT CTACCAAGTA AATCTGCTGT 
ATCTGACACA TGACTCTTGG TTGCGTTGCT CCAATTGCAG GGAAAGAGAA GGAAGTCATG 
TCGATGGAAA ATGGCGGCAA CGCCAAGGTC AACGCAGTCT TTGAAGCGAA CTTGGCTCGA 
TCCGGAGCCG CCAAGCCAAC CAACTTGGCC GATGGCCCTA CACGGGAACG TTTCATCCGG 
GACAAATACG AACGTCGCAA ATACTACGAC GCCGCGGCTT TTGGTAACCT ACCGACACCG 
TCTCCCACGG CGAATCGCAC TAGCACCAGC GCACCGTCCA GTGCAGTCGG ACCGCCTTCG 
GAAGCCGCCC GACAACGCAT GGAAGCACGT CGTTTGAAAA AGTCGCAGTC GGCTTTTACT 
GCCGATACAC AGAGCCATGC TATTGCCAAT ACGGCTCCAC CGAAACGGGC CACCTCCTCG 
GTCGGTAC

Protein sequence

MADQKIMKKR LKELMNRPEN QVCSDCPERQ PRWASLIVPP PGAPPGSLPM GAFCCLECSG 
SHRRLGVHIS FVRSINLDSW KEKEVMSMEN GGNAKVNAVF EANLARSGAA KPTNLADGPT 
RERFIRDKYE RRKYYDAAAF GNLPTPSPTA NRTSTSAPSS AVGPPSEAAR QRMEARRLKK 
SQSAFTADTQ SHAIANTAPP KRATSSVG