Gene Pisl_1778 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pisl_1778
Symbol
ID	4616535
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum islandicum DSM 4184
Kingdom	Archaea
Replicon accession	NC_008701
Strand	+
Start bp	1615892
End bp	1616878
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	55%
IMG OID	639784862
Product	3-deoxy-7-phosphoheptulonate synthase
Protein accession	YP_931270
Protein GI	119873263
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	75
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTGTATA TAGTCGAGGG GCCTCAACAA GGGAAATCTC TAAAGGAAGA GATAGAGGCT 
AGGGGAGTTC CTGCATGGTA TGTAGAGCTT TGGGGGAACT ATATAGTAGT TACGCCGCCA 
AATGTCCGAC TCCAAGGGTT GAACACGCCA GTTAAAGCCG CCATAGAATT AAAGACAGAC 
AGTCAGCTGG TCTCCAGGGA GTGGAAGAGG GATCCCACGC CTGTCTACAT CGGCGGTAGA 
GAGGTTAGAG AGGGGAAGAT CTTCATAATA GCAGGTCCTT GTTCTGTAGA GACCGAGGAC 
CAGATCATGA AGACAGCGAG GTTTGTAAAA GAGGCTGGGG CAGACGCGTT GAGGGGAGGG 
GCCTTCAAGC CGAGGACAAG CCCATACACT TTCCAAGGCC TAGGGGAGGA GGGGCTGAAG 
CTACTGGCCA AGGCCAGGGA GGAGACGGGC CTCCCCGCCG TCACGGAGCT TATGGACCCG 
GAGGATATGC CGCTGGTGGT TAGATACGCA GACGCGATAC AGGTGGGGGC TAGAAACATG 
CAGAACTTCA CTCTTCTGAA GAAGCTCGGC CGAGCGGGCA AGCCGGTGCT TCTCAAGAGA 
GGCTTTGGAA ACACCATAGA GGAGTGGCTA CTGGCGGCTG AGTACGTGGC TCTCCACGGC 
AACGGCGGTA TAATCCTAGT GGAGAGAGGT ATTAGAACCT TCGACAAAAC CCTTAGGTTT 
ACGCTCGACG TAGGCGCGAT AGCCTACGCC AAACAACACA CCCACTTGCC TGTGATAGGC 
GACCCCAGCC ACCCGGCTGG AGACAGGAGA TACGTCATAC CGCTGGCCCT CGCCATATTA 
GCGGCTGGGG CAGACGGTCT AATCGTGGAG GTGCACCCGG ACCCCGACAA GGCGTGGAGC 
GACGCAAAAC AACAACTCAC CTTCGACCAG TTCAGAGAGC TTGTACAAAA GGCTAGAGAA 
GTGGCGAGGG CTCTAGGCAA GAGCTAA

Protein sequence

MLYIVEGPQQ GKSLKEEIEA RGVPAWYVEL WGNYIVVTPP NVRLQGLNTP VKAAIELKTD 
SQLVSREWKR DPTPVYIGGR EVREGKIFII AGPCSVETED QIMKTARFVK EAGADALRGG 
AFKPRTSPYT FQGLGEEGLK LLAKAREETG LPAVTELMDP EDMPLVVRYA DAIQVGARNM 
QNFTLLKKLG RAGKPVLLKR GFGNTIEEWL LAAEYVALHG NGGIILVERG IRTFDKTLRF 
TLDVGAIAYA KQHTHLPVIG DPSHPAGDRR YVIPLALAIL AAGADGLIVE VHPDPDKAWS 
DAKQQLTFDQ FRELVQKARE VARALGKS