Gene PHATRDRAFT_24353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PHATRDRAFT_24353
Symbol	AroA
ID	7196691
Type	CDS
Is gene spliced	Yes
Is pseudo gene	No
Organism name	Phaeodactylum tricornutum CCAP 1055/1
Kingdom	Eukaryota
Replicon accession	NC_011669
Strand	-
Start bp	278070
End bp	279983
Gene Length	1914 bp
Protein Length	500 aa
Translation table
GC content	51%
IMG OID
Product	3-deoxy-7-phosphoheptulonate synthase
Protein accession	XP_002177054
Protein GI	219110605
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

CACCAATCAG TCAACGCCTC TATAGTCGGT ACCTCCCTAC CGTATCCTTT CGCGTGACCA 
TGATGCTGAA ATTAGCAAGT GCCCTATTGC TGCTGGCATC GTCAGAGGCT TTTACGCCCC 
AGTCGTTAGT GGGGTAAGTT ATGATCCGAT TCTAATATTC CGTGACTGTG ACCGATTTGT 
TCCTTGGAAT GCAATAGTGA TAGGTTTTGC ATTTTTCGCC AAAACTTTAT TTGTCGAAGC 
GAATCTTGTA TTCACGTGTA AGGACACATA TCGTTGGCAA TTGTTCCCAG CGTAAGACTC 
ATGGTGCTTC GATCTCGTGT TGTTCTTGTT CATTAGACGC CGTCAATCGG CGTTGTCGGT 
GGCGACGGAA CCGCCCGCTT CGACGGCTGC CACTACCGGG GGCAATACCG ACTGGAGTCC 
TCGTTCGTGG AGAGAAAGAG AAGTTCAACA AGGACCAAAC TACGAAGATG AAGAAGAATT 
GGAACAAGCC ATCGACACCA TAAAGAAGTT TTCTCCTTTG GTCTTTGCGG GTGAAGTTCG 
TTCCTTGCAC GAGCAGTTGG CTCGTGCCTG TTCGGGGCAA GGCTTCTTGC TGATGGGCGG 
CGACTGTGCC GAAGCGTTTA ACGAATTTAA TGTCGATCAC GTCCGTGACA GTTTCCGTGT 
CCTTTTGCAA ATGGCTCTGG TGTTAACCTT TGGTTCGGCC ATGCCAGTCA TCAAGGTCGG 
TCGCATGGCT GGTCAGTTTG CCAAGCCTCG CAGTGAACCG GATGAGGTCC GTGACGGTGT 
GGCGTTGCCT TCGTACCGTG GAGATATCAT CAACCGCGAA GAGTTCACAC CGGAAGCCCG 
TCGCCACAAT CCCAATAATA TGGTCGAAGC GTACCACCAA TCGGCGCAGA CATTAAACAT 
TCTCCGTGCC TTTTCAACCG GAGGATACGC TGATATGAGT AGGCTACACG CCTGGAATTT 
GGACTTTGTT GAGACGACGG ATGAGGGTAG CCGGTACGTC CGTCTTTGCA GCCAAATGTG 
TATGCCGCGT TTTGGATCCA GAAACTCACC GCTCGATATG CAAAATTTTA TTTCCTTCTC 
TCAGCTACCG AAAGTTCGCG ACCAAGGTTG ACGAGTCGCT CCGTTTCATG AAGGCCATTG 
GTGTCGACAC CAGCAGCCCC ACCTTTACCA AAACCGAGTT TTACACGGCT CACGAATGTC 
TTTTACTGCC GTACGAAGAA GCCCTGACCC GCAAGGACTC AACTACCGGA CGCTACTACG 
ATTGCTCAGG CCATATGCTG TGGGTTGGAG AGCGCACTCG TCAATTGGAT GGTGCCCACT 
TGGAATTCGT ACGCGGAATT GGAAATCCGC TGGGAGTCAA GATTTCGGAC AAGTGCACAC 
CGGAAGAACT CATCCGCATC ATCGATACTA TGAATCCCCA AAATATTCCC GGGCGTCTGA 
CGATTGTCGT CCGCATGGGG GCCGAGAAAG TTCGCAAGAA TCTTCCAGCC TTAATCCGTG 
CCGTACAACG TGAGGGCAAG TCGGTCTTGT GGATTTCCGA CCCTGTTCAC GGCAATACTT 
ACAAGACCGA TTCTGGTATC AAGACGCGCA ACTTTGACGC AATCCGTGAC GAGCTTCGTG 
CTTTCTTCGA CGTGCACGAC GAAATGGGCA GCCATCCCGG TGGCGTGCAT TTGGAAATGA 
CCGGAGAAGA TGTGACCGAG TGCACGGGAG GAATTAGTGG CGTGTCTGAG GATACTCTGA 
ACGATCGCTA CCACACGTTT TGTGATCCTC GCTTGAACGG AGCTCAAGCT TTGGAGCTGG 
CCTTTTTGAT TGCCGAGCGA ATGCGTCTGC GAACTGGACT ACCACCGATC GAGTAAATTG 
TGTAAGGACT ACATAAACAG AAACTTACAA AGAATTAGGA TTTGTGGAGC GAGA

Protein sequence

MMLKLASALL LLASSEAFTP QSLVGRRQSA LSVATEPPAS TAATTGGNTD WSPRSWRERE 
VQQGPNYEDE EELEQAIDTI KKFSPLVFAG EVRSLHEQLA RACSGQGFLL MGGDCAEAFN 
EFNVDHVRDS FRVLLQMALV LTFGSAMPVI KVGRMAGQFA KPRSEPDEVR DGVALPSYRG 
DIINREEFTP EARRHNPNNM VEAYHQSAQT LNILRAFSTG GYADMSRLHA WNLDFVETTD 
EGSRYRKFAT KVDESLRFMK AIGVDTSSPT FTKTEFYTAH ECLLLPYEEA LTRKDSTTGR 
YYDCSGHMLW VGERTRQLDG AHLEFVRGIG NPLGVKISDK CTPEELIRII DTMNPQNIPG 
RLTIVVRMGA EKVRKNLPAL IRAVQREGKS VLWISDPVHG NTYKTDSGIK TRNFDAIRDE 
LRAFFDVHDE MGSHPGGVHL EMTGEDVTEC TGGISGVSED TLNDRYHTFC DPRLNGAQAL 
ELAFLIAERM RLRTGLPPIE