Gene Syncc9605_1298 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_1298
Symbol	ispG
ID	3737241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	+
Start bp	1209698
End bp	1210894
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	60%
IMG OID	637775888
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_381607
Protein GI	78212828
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCCC TGGCTCGGCG CTACGACACC CAGATCCACC GCCGTGTGAC CCGCACTGTG 
ATGGTGGGTG ATGTGCCGGT AGGCAGCGAG CACCCGATCG TGGTGCAGTC GATGATCAAC 
GAGGACACCC TCGATATCGA GGCTGCTGTA GCCGGCATCA TCCGCCTTGC CGAAGCCGGC 
AGTGAGATCG TTCGGGTGAC GACGCCCTCA ATGGCCCACG CCAAGGCGAT GGGACAGATC 
CGTAAGGAGC TTCGTCAGCG CGGCTGCAGC GTTCCCCTGG TGGCGGACGT TCACCACAAC 
GGCGTCAAGA TCGCCCTGGA GGTCGCCCAG CACGTCGACA AAGTTCGGAT CAATCCCGGC 
CTGTTCATTT TTGATAAGCC AGATCCGAAC CGCCAGGAGT TCAGCCCCGA AGAATTTGCT 
GCCATCGGCC AGCGCATTCG TGAGACGTTT GAGCCCTTGG TGACCCTGCT GCGGGACCAG 
AACAAAGCGC TTCGAATCGG TGTGAACCAT GGCTCCCTGG CGGAGCGGAT GCTGTTCACC 
TACGGCGACA CCCCTGAGGG GATGGTCGAA TCAGCGATGG AATTCGTGCG CATCTGCCAC 
GAGCTTGATT TTCACAACAT CCTGATTTCG ATGAAGGCCT CGCGGGCTCC TGTGATGCTC 
GCGGCTTACC GCCTGATGGC GGACACCATG GACAAGGAAG GCTTCAATTA CCCCTTGCAC 
TTAGGCGTGA CCGAAGCCGG CGATGGTGAT TACGGCCGCA TCAAGAGCAC CGCAGGCATT 
GCCACTCTGC TGGCCGATGG ATTGGGAGAC ACCCTCCGGG TTTCCCTGAC GGAGGCCCCC 
GAAAAAGAAA TCCCCGTCTG TTACTCGATT CTCCAATCCC TGGGTCTGCG CAAGACCATG 
GTCGAGTACG TCGCCTGCCC CAGCTGCGGT CGCACCCTGT TCAATCTGGA GGAGGTGTTG 
CACAAGGTTC GCAACGCCAC ATCCCACCTC ACGGGTCTGG ACATCGCCGT GATGGGGTGC 
ATCGTCAATG GCCCTGGCGA AATGGCCGAC GCTGATTACG GCTACGTCGG CAAAACCCCT 
GGCGTGATTT CGCTGTATCG CGGTCGTGAT GAAATCCGCA AGGTGCCTGA AGCTGAGGGC 
GTTGAAGCCC TGATCCAGTT GATCAAAGAG GACGGTCGCT GGGTGGAGCC CGCCTGA

Protein sequence

MTALARRYDT QIHRRVTRTV MVGDVPVGSE HPIVVQSMIN EDTLDIEAAV AGIIRLAEAG 
SEIVRVTTPS MAHAKAMGQI RKELRQRGCS VPLVADVHHN GVKIALEVAQ HVDKVRINPG 
LFIFDKPDPN RQEFSPEEFA AIGQRIRETF EPLVTLLRDQ NKALRIGVNH GSLAERMLFT 
YGDTPEGMVE SAMEFVRICH ELDFHNILIS MKASRAPVML AAYRLMADTM DKEGFNYPLH 
LGVTEAGDGD YGRIKSTAGI ATLLADGLGD TLRVSLTEAP EKEIPVCYSI LQSLGLRKTM 
VEYVACPSCG RTLFNLEEVL HKVRNATSHL TGLDIAVMGC IVNGPGEMAD ADYGYVGKTP 
GVISLYRGRD EIRKVPEAEG VEALIQLIKE DGRWVEPA