Gene PHATRDRAFT_37886 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_37886
Symbol
ID	7202827
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011682
Strand	-
Start bp	322222
End bp	323367
Gene Length	1146 bp
Protein Length	381 aa
Translation table
GC content	48%
IMG OID
Product	predicted protein
Protein accession	XP_002182046
Protein GI	219123468
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0323798
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTCGA TAGCGCCAAT CGTATCAGCT TTGGAAGACA CTGAGGAGCC GAACTCGGCT 
TCTGAAAGAC TTACAGCTGA CTGGAAGCAC AGACTCGTGG TACATTTTGA CATCAACGAG 
ACGATCTTGG TCGGCGACGA TGCCGGGGGA GATACGCGCG AGGATTGTAT CCATAAGATA 
ATCGCAAAAT CTGCGTACGT TAAGATACCT TTCGGGTACG CGGGGGGATC CTACGAGGAC 
AACTCGAATT TAGAGCCAAC CGAATGGTGG AATGGGCTTT TAATCAGGGA GGAATACGAC 
GAGAAGCTAG CTTTAAATCG GGTTCCTCCG TTGTACACAG GATGGCAGTG GCCACCAGGC 
TGCTGCCCTT ACTATCGGAC TGCTTTTAAA AACCGTGCCA GAACTTTTGT GAATCACCAT 
GGCTCGTTAT ACAAATCGAC CTATCTCAGA GTGGAAGAGC TACTCCCAAT CCCAGATTCC 
AAGCCTGGAA ACGCTTTTTC CGTTTTTGCA CACATGCTAC CTGCTTTTTT TGAAACTGTT 
GTAAAGCTTT CCAGCAGACC CCAGCCCTAT ACATTGGTTT TTCGTACCAT GGGTTCTGAT 
CTCGAAAAAA TTGCAACAGC GTTCAATGCT TTTGCTTCTG GCAAACATCC CAACTATCCT 
AATTTTCAGC GAGAGGACTT GATCATAAGC CGGCATGATC TTGTTGAAGG ACGATGGTCG 
AAAGAAGTCG ACTTGGACGG AAATCACGTC TTCCAATTTT GGAGAGCCGG TGAGATGATT 
GCTTCTGGAG ACGCGCAGGT GCTCGACTTT CTTGACTCTC GAAGCGTTTG CGGTATTCAG 
GATGACTACG AATTTTGGAA GGTCCACAGA CACCAACCTT GGGCCGGCAA GCCCGTTTGG 
ATTCCCCGAA GCAAGGAAGT TCAGCATATT TTGCTGGACG ACAACATTCA CAATTTGTCT 
CATGATAGCA TAGCTAGTAC CCGAGTGGAG CGAGAAGATG GTAGTTTCCG AACACTGTCC 
GATGAAGAAA TCAGAGATCA GCAAGGTATC CACCTTGTGA GGGTACCCAC TGTTGCCCCA 
ATTCTTCAGC CGACGTGGTT TCTCGAACAA ATAGATAGTG CCCAAAGACG GTTTGTAAGC 
GAATGA

Protein sequence

MDSIAPIVSA LEDTEEPNSA SERLTADWKH RLVVHFDINE TILVGDDAGG DTREDCIHKI 
IAKSAYVKIP FGYAGGSYED NSNLEPTEWW NGLLIREEYD EKLALNRVPP LYTGWQWPPG 
CCPYYRTAFK NRARTFVNHH GSLYKSTYLR VEELLPIPDS KPGNAFSVFA HMLPAFFETV 
VKLSSRPQPY TLVFRTMGSD LEKIATAFNA FASGKHPNYP NFQREDLIIS RHDLVEGRWS 
KEVDLDGNHV FQFWRAGEMI ASGDAQVLDF LDSRSVCGIQ DDYEFWKVHR HQPWAGKPVW 
IPRSKEVQHI LLDDNIHNLS HDSIASTRVE REDGSFRTLS DEEIRDQQGI HLVRVPTVAP 
ILQPTWFLEQ IDSAQRRFVS E