Gene Pcal_0891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Pcal_0891
Symbol
ID	4909036
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pyrobaculum calidifontis JCM 11548
Kingdom	Archaea
Replicon accession	NC_009073
Strand	-
Start bp	848428
End bp	849417
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	62%
IMG OID	640124640
Product	3-deoxy-7-phosphoheptulonate synthase
Protein accession	YP_001055783
Protein GI	126459505
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTTATA TAGTCGATGG GCCTGAGAGG GGGAAGGCCT TGAGGGAGGA GCTGGAGTCG 
AGGGGGGTAC CGGCTTGGTA TATAGAGCTC TGGGGGCACT ACATAGTTGC CACGCCGCCG 
GGGGCGAGGA CCGAGGTCAA GACCCCCGTC AAGGCCGTCG TGGAGCTTAA GACCGACTAC 
CAGCTAGTGT CGCGGGAGTG GAAGAGGGAT CCAACGCCCG TGTTTATAGG GGATAGAGAA 
GTGCGGGAGG GCAAGGTCTT CATTATTGCG GGGCCTTGCT CAGTCGAGGG AGAGGAGCAG 
ATTATCTCTA CGGCGCTGGC CGTCAAAGAG GCTGGGGCAC ATGCGCTGAG GGGAGGGGCC 
TTCAAGCCGC GGACGAGCCC CTACGCCTTC CAAGGCCTGG GGGAGGCGGG GCTTAAGCTC 
TTGGCTAAGG CTAGGGAGGC CACTGGGCTC CCGGTGACCA CCGAGCTGAT GGACCCAGAG 
GACCTCCCGC TGGTGGCCAA GTACGCCGAC GCGATACAAG TGGGGGCCAG GAATATGCAG 
AATTTTACGT TGTTAAAGAA GCTGGGGAGG GCGGGGAAGC CCATACTGCT CAAGAGGGGG 
TTTGGCAACA CTGTGGAGGA GTGGCTACTG GCGGGGGAGT ACGTGGCTCT CCACGGGAAT 
GGGGGCGTGG TGTTCGTGGA GAGGGGGATT AGGACGTTTG ACCGCACTCT GCGTTTTACC 
CTGGACGTGG GGGCCATCGC CTACGTAAAA CAACACACTC ACTTGCCTGT GATAGGCGAC 
CCGAGCCACC CCGCCGGCGA CCGGCGCTAC GTCATTCCGC TCGCCTTGGC CATACTGGCG 
GCGGGGGCAG ACGGCCTAAT CGTCGAGGTG CACCCAGACC CAGACAAGGC GTGGAGCGAC 
GCCAAACAAC AACTCACCTT TGACCAGTTT AGGGAGCTTA TGGCTAAGGC GAGGGAGCTG 
GCCCGGGCTC TTGGGAAAGA GTTCCCGTAG

Protein sequence

MLYIVDGPER GKALREELES RGVPAWYIEL WGHYIVATPP GARTEVKTPV KAVVELKTDY 
QLVSREWKRD PTPVFIGDRE VREGKVFIIA GPCSVEGEEQ IISTALAVKE AGAHALRGGA 
FKPRTSPYAF QGLGEAGLKL LAKAREATGL PVTTELMDPE DLPLVAKYAD AIQVGARNMQ 
NFTLLKKLGR AGKPILLKRG FGNTVEEWLL AGEYVALHGN GGVVFVERGI RTFDRTLRFT 
LDVGAIAYVK QHTHLPVIGD PSHPAGDRRY VIPLALAILA AGADGLIVEV HPDPDKAWSD 
AKQQLTFDQF RELMAKAREL ARALGKEFP