Gene PHATRDRAFT_39147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_39147
Symbol
ID	7194887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011686
Strand	+
Start bp	444278
End bp	445441
Gene Length	1164 bp
Protein Length	387 aa
Translation table
GC content	53%
IMG OID
Product	predicted protein
Protein accession	XP_002183097
Protein GI	219125669
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGACGC CCACGAGGCA GCGTCGCAAG TTACGGCCTC TCATCATTAC CATGGGAGGC 
CCGCGACGGG AAAGCTTGGA AGCCTTGTTC GCCGAACCCG CCATGGCCGC AAATTTTGAA 
CCTCCCATAT TTTCCCCCGG CGTACCCAGC CGCAGTTTGC GTTCGCGGTA TCAGTTTTTG 
TCTCAGGCGT ACCGAGCGGG ACTCTTGCCG GAAGCCGAGT GGGAAGCCGT GCGGGACCAC 
GATTGCGCGC CGGACGAAGG CGACACTTCG ACCGATGCGT TTTTTGCAGG TCTCGGCGAC 
GTGCCGGTGA CGACGGGGCG ACGAGGTAGT GCAGCCGACA TCCGCTTGCA CTACTCTAGG 
GAGTTGTGGC AAAAAGCCAA GGGTATCAAT CGAGGTCGGG CGGTGTTGGG TTGCACCTTT 
GCACATCTAA TTGCTTTGCG AGTACTGGTA GATCAAGAAC TGGACTTTGT ATTGGAAGAC 
AATGTCCGTG TCCCCCTTAC TTCGTGTGCC GATCGAATTT GGGAGCTGCT CGAGGCTACC 
TCGAATCGAA AGTGCCACCA TCGGTACTAC GGCTGGTTAG GTTCCGTGCC TAATTTGCGT 
TGGATTTACG ATTTTCACGC TCCCAGGTTC TCGCATGCAT CGGACATCTT CGAGCACTTC 
GCAGCTTTTC CCTTTCCCAG TAACGAGGAT ATTGGAAACG ACCTCACCGC AAAGGAAGCC 
AATAGCCAAA GCGAGATCAA TGAGAGGGAT AGTGAGACCG ACCATAGGCA GCTTGACGAA 
CGCAAACCCG GAGGAAATCC AGTTTGGGGT TGTTACGCCT ACTGGATCTC GAAAGAAGCG 
TTTGCCGAGC TAATGGAGAC ATTGCGCAAC GACGTGGGAG CTATGCTGTG GAAAACGAAA 
CGTGCCCGCC ATTACATAGT CAAGCCCATC GATAAGATTC TTCCGCGACT AGTTATGCGA 
ACGTATGGAC AAGAAGCCGT CCTGCTACCC TCTCATCCAG CGTTTTTCCG AGCCCCAATG 
TTGACCAGTA AAATCCATAC AAAGTGGGAC GCTGAATTCT GTAAAAGTAC AAAATTCCAA 
CTAGAGCATT CTGGTTTAAG TTGGTCCGAT TTGTGGCTCA CGGCAATGGA AAAGGCAGTA 
GTAGCATATC ACGAGCAAGA GTGA

Protein sequence

MSTPTRQRRK LRPLIITMGG PRRESLEALF AEPAMAANFE PPIFSPGVPS RSLRSRYQFL 
SQAYRAGLLP EAEWEAVRDH DCAPDEGDTS TDAFFAGLGD VPVTTGRRGS AADIRLHYSR 
ELWQKAKGIN RGRAVLGCTF AHLIALRVLV DQELDFVLED NVRVPLTSCA DRIWELLEAT 
SNRKCHHRYY GWLGSVPNLR WIYDFHAPRF SHASDIFEHF AAFPFPSNED IGNDLTAKEA 
NSQSEINERD SETDHRQLDE RKPGGNPVWG CYAYWISKEA FAELMETLRN DVGAMLWKTK 
RARHYIVKPI DKILPRLVMR TYGQEAVLLP SHPAFFRAPM LTSKIHTKWD AEFCKSTKFQ 
LEHSGLSWSD LWLTAMEKAV VAYHEQE