Gene Sare_1454 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_1454
Symbol
ID	5704165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	1679471
End bp	1681453
Gene Length	1983 bp
Protein Length	660 aa
Translation table	11
GC content	73%
IMG OID	641270963
Product	1-deoxy-D-xylulose-5-phosphate synthase
Protein accession	YP_001536344
Protein GI	159037091
COG category	[H] Coenzyme transport and metabolism [I] Lipid transport and metabolism
COG ID	[COG1154] Deoxyxylulose-5-phosphate synthase
TIGRFAM ID	[TIGR00204] 1-deoxy-D-xylulose-5-phosphate synthase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0111876
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGTTG AACCGGACAC GGCAAACCAC CCGGGGCTGC TGGCCGCCGT ACGCGGCCCG 
CAGGACGTCA AGCGGATGTC CACCGAGCAG TTGGGCATCC TCGCCGCCGA GATCCGTGAC 
TTCCTGGTCG CCAAGGTCTC CCGCACCGGC GGGCACATCG GCCCCAACCT GGGCGTGGTG 
GAGCTGACCC TCGCGCTGCA CCGGGTCTTC GACTCCCCGC GGGACCGGCT CCTGTTCGAC 
ACCGGCCACC AGGCCTACGT ACACAAGATC CTCACCGGCC GGCAGGACGG CTTCGACCGG 
CTGCGCCAGC GTGACGGGCT CTCCGGCTAC CCGAGCCAGG CCGAGAGCGA GCATGACCTG 
ATCGAGAACT CGCACGCCTC CACCGCCCTG TCCTACGCCG ACGGGCTGGC CAAGGCGTAC 
GCGCTGCGGG GTGAGTCCCG GGCGGTGGCG GCCGTGGTCG GCGACGGCGC GCTGACCGGC 
GGTATGTGCT GGGAGGCGTT GAACAACATT GCGACCGCCG GCAACCCACT GGTGATCGTG 
GTCAACGACA ACGGCCGGTC CTACTCGCCG ACCATCGGTG GGCTCGCCGA CCACCTGTCG 
ACGCTGCGCC TGAATCCCAG CTACGAGCGG GTGCTGGACA CGGTCCGCGA GGCGCTCGGC 
TCGACCCCGC TGGTCGGCCG GCCGATGTAC GAGGTGCTGC ACGCGGTCAA GCGGGGCATC 
AAGGACGCGG TCGCGCCGCA GGCGATGTTC GAGGACCTCG GCATCAAGTA CGTCGGCCCG 
GTCGACGGGC ACGACATCGT GGCGGTCGAG GGGGCCCTGC GCGCGGCGAA GAACTTCGGC 
GGCCCCGTGA TCGTGCACGC GGTCACCCGC AAGGGCTACG GGTACCGCCC GGCCGAGGAG 
GACGAGGCCG ACTGCCTGCA CGGCCCGGGC GCGTTCAACG TCGAGACCGG CCAACTGGTC 
GCCGCGCCGA CGGTGAAGTG GACCCACGTC TTCGCCGACG AGTTGGTGGC GATCGCCGAC 
GAGCGACCGG ATGTGGTGGG GATCACCGCC GCGATGGCCG AGCCGACCGG CATCGCCAAG 
CTCGCCCGCA AGTATCCGGA GCGCACCTAC GACGTGGGTA TCGCCGAGCA GCACGCCGCC 
ACCTCGGCGG CCGGCTTGGC GCTGGGCGGT CTGCACCCGG TGGTCGCGGT CTACGCGACC 
TTCCTGAACC GGGCGTTCGA CCAGGTCCTG CTGGACGTGG CGATGCACAA GCTGCCGGTG 
ACCTTCGTGC TCGACCGGGC CGGGATCACC GGCCCGGACG GGCCCAGCCA CTACGGCATG 
TGGGACATGT CCGTCTTCGG GGTGGTGCCG GGCCTGCGGA TCGCCGCGCC CCGCGACGCC 
GCCACCCTCC GCGAGGAACT GCGCGAGGCA GTCGCCGTCA ACGACGGGCC GACCATCGTC 
CGGTTCCCGA CCGGCGCCGT CGCCGCCGAC CTGCCGGCGC TGCGCCGGGT CGGGCCGGTC 
GACGTGCTCG CCGAGTCGGC CCGCACCGAC GTGCTGCTGG TCGCGGTCGG CTCCTTCGCC 
GGCCTGGGTG TGCAGGTCGC CGGCCGGGTC GCCGAGCAGG GCTACGGTGT CACCGTCGTG 
GACCCGCGCT GGGTCCGGCC GGCCCCGGCC GAACTGGTGG AACTGGCCGC CGGGCACCGG 
CTCGTGGTCA CCGTGGAGGA CGGCGTCCGG GTTGGTGGGG TCGGCGACGC GCTCGCCCAG 
GCGATGCGGG ACGCCGACGT CGAGGTGCCG GTGAAGGACC TCGGAGTGCC GGCCGACTGG 
CACCCGCACG GCACCCGGGC GCAGATCCTC GCCGACCTCG GTCTGACCGC CCAGGACGTG 
GCCCGCGACG TCACCGGCTG GATCTCCCGC CTCGACGTCG ACGCCGCCGA CACCGAGGAC 
GCGCTCGCGT CCGAGCCGGT GGGGTCGGTC GTCACCCCGC GGGAGGCTCC CGCTCCGAAG 
TGA

Protein sequence

MSVEPDTANH PGLLAAVRGP QDVKRMSTEQ LGILAAEIRD FLVAKVSRTG GHIGPNLGVV 
ELTLALHRVF DSPRDRLLFD TGHQAYVHKI LTGRQDGFDR LRQRDGLSGY PSQAESEHDL 
IENSHASTAL SYADGLAKAY ALRGESRAVA AVVGDGALTG GMCWEALNNI ATAGNPLVIV 
VNDNGRSYSP TIGGLADHLS TLRLNPSYER VLDTVREALG STPLVGRPMY EVLHAVKRGI 
KDAVAPQAMF EDLGIKYVGP VDGHDIVAVE GALRAAKNFG GPVIVHAVTR KGYGYRPAEE 
DEADCLHGPG AFNVETGQLV AAPTVKWTHV FADELVAIAD ERPDVVGITA AMAEPTGIAK 
LARKYPERTY DVGIAEQHAA TSAAGLALGG LHPVVAVYAT FLNRAFDQVL LDVAMHKLPV 
TFVLDRAGIT GPDGPSHYGM WDMSVFGVVP GLRIAAPRDA ATLREELREA VAVNDGPTIV 
RFPTGAVAAD LPALRRVGPV DVLAESARTD VLLVAVGSFA GLGVQVAGRV AEQGYGVTVV 
DPRWVRPAPA ELVELAAGHR LVVTVEDGVR VGGVGDALAQ AMRDADVEVP VKDLGVPADW 
HPHGTRAQIL ADLGLTAQDV ARDVTGWISR LDVDAADTED ALASEPVGSV VTPREAPAPK