Gene Ava_0433 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0433
Symbol	ispG
ID	3682594
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	551923
End bp	553149
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	44%
IMG OID	637715762
Product	4-hydroxy-3-methylbut-2-en-1-yl diphosphate synthase
Protein accession	YP_320954
Protein GI	75906658
COG category	[I] Lipid transport and metabolism
COG ID	[COG0821] Enzyme involved in the deoxyxylulose pathway of isoprenoid biosynthesis
TIGRFAM ID	[TIGR00612] 1-hydroxy-2-methyl-2-(E)-butenyl 4-diphosphate synthase

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.000301466
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.208688
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAAACTC TGCCGACACC CACAACATCC AGTAATACAG CCAACCAAAG CACATTTGAT 
ACGACAATCA AGCGTCGTAA AACCCGTCCG GTAAAAGTGG GTAATGTCAC CATCGGCGGT 
GGCTACCCTG TGGTGGTGCA GTCGATGATT AACGAAGACA CTCTTGATAT CGACGGTTCC 
GTAGCCGCTA TTCGGCGCTT GCACGAAATT GGCTGTGAAA TCGTCCGTGT CACAGTGCCA 
AGCATAGCTC ACGCCGTAGC GTTGGCAGAA ATTAAACAAA AACTCATTAC AACTTACCAA 
GATGTGCCAA TTGTTGCTGA CGTACACCAC AATGGGATGA AAATTGCCCT GGAAGTTGCC 
AAACATATTG AAAAAGTACG GATAAACCCC GGCTTGTATG TGTTTGAGAA ACCCAACACC 
AATAGAACTG AATATACTCA AGCCGAATTT GAAGAAATTG GCGAAAAAAT CCGCGAAACT 
CTCGCACCCT TGGTAATTAC TCTGCGCGAC CAAGGTAAAG CCATGCGTAT TGGTGTCAAT 
CATGGTTCTC TCGCTGAGAG AATGTTATTT ACCTACGGCG ATACTCCAGA AGGCATGGTG 
GAATCAGCTT TAGAATTTAT TCGCATCTGT GAATCTCTAG ACTTCCGCAA CATAGTCATT 
TCCATGAAAG CCTCACGAGT TCCCGTGATG GTAGCCGCCT ATCGCCTCAT GGCTAAACGC 
ATGGATGATT TAGGCATGGA TTATCCCTTA CATTTAGGTG TCACCGAAGC TGGTGATGGT 
GAATATGGAC GGATTAAATC CACAGCAGGT ATTGCCACAT TATTAGCTGA TGGTATTGGT 
GATACTATTC GCGTCTCCCT AACAGAAGCA CCGGAAAAGG AAATTCCAGT CTGTTACAGC 
ATTCTGCAAG CTTTAGGTTT GCGGAAAACA ATGGTGGAAT ATGTAGCTTG TCCTTCCTGC 
GGTCGTACTT TATTTAACTT AGAAGAAGTA CTACATAAAG TACGTGAATC TACTAAACAC 
CTCACAGGAC TAGACATTGC TGTTATGGGT TGCATTGTCA ATGGCCCAGG CGAGATGGCT 
GATGCTGACT ACGGTTATGT AGGTAAAACT CCTGGTTACA TTTCTTTATA TCGTGGCAGA 
GAAGAAATTA AAAAAGTTCC AGAAGATAAA GGCGTTGAGG AATTAATTAA CCTCATTAAA 
GCTGATGGTC GCTGGGTAGA TCCTTAG

Protein sequence

MQTLPTPTTS SNTANQSTFD TTIKRRKTRP VKVGNVTIGG GYPVVVQSMI NEDTLDIDGS 
VAAIRRLHEI GCEIVRVTVP SIAHAVALAE IKQKLITTYQ DVPIVADVHH NGMKIALEVA 
KHIEKVRINP GLYVFEKPNT NRTEYTQAEF EEIGEKIRET LAPLVITLRD QGKAMRIGVN 
HGSLAERMLF TYGDTPEGMV ESALEFIRIC ESLDFRNIVI SMKASRVPVM VAAYRLMAKR 
MDDLGMDYPL HLGVTEAGDG EYGRIKSTAG IATLLADGIG DTIRVSLTEA PEKEIPVCYS 
ILQALGLRKT MVEYVACPSC GRTLFNLEEV LHKVRESTKH LTGLDIAVMG CIVNGPGEMA 
DADYGYVGKT PGYISLYRGR EEIKKVPEDK GVEELINLIK ADGRWVDP