Gene Smed_0527 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_0527
Symbol	ispH
ID	5321361
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	568944
End bp	569954
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	62%
IMG OID	640789461
Product	4-hydroxy-3-methylbut-2-enyl diphosphate reductase
Protein accession	YP_001326218
Protein GI	150395751
COG category	[I] Lipid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0761] Penicillin tolerance protein
TIGRFAM ID	[TIGR00216] (E)-4-hydroxy-3-methyl-but-2-enyl pyrophosphate reductase (IPP and DMAPP forming)

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.49504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGGCCT CATCCGTAGC AAAAACCCCG ATCACCATCC GCCTCTGCGG GCCGCGTGGC 
TTCTGCGCGG GCGTCGACCG GGCGATCCAG ATCGTGGTGC TTGCGCTCAA GGAGTTCGGC 
GCGCCGGTCT ATGTCCGTCA TGAGATCGTG CACAATCGCT ATGTCGTGGA AGGTCTTGAA 
GCCAAGGGTG CGATTTTCGT CGAGGAGCTC GACGAGATTC CACCCGAGCA TCGCAAGCAG 
CCCGTCGTCT TCTCCGCCCA CGGCGTGCCG AAATCCGTCC CCGCGGATGC GGATGCGCGC 
AATCTCTTCT ATCTCGATGC CACATGCCCG CTCGTCTCGA AGGTGCACAA ACAGGCTATG 
CGCCATCACC GTATGGGGCG CCATGTGGTG CTGATCGGCC ATGCCGGCCA TCCCGAGGTT 
ATCGGCACCA TGGGGCAACT GCCGGAGGGG ACGGTCTCCC TCATCGAGAC TGTCGAGGAT 
GTCGACGTTT ATACGCCCCC GGATCCGGAC AATCTCGGCT TTGTTACGCA GACGACGCTC 
TCGGTGGATG ATACCGCCGG CGTCATCAAG CGGCTCCATG AGCGCTTTCC GAACCTGACT 
GCGCCTGCCG CCGACTCGAT CTGCTACGCC ACCACGAACC GGCAGGAAGC GGTGAAGCAG 
GCTGCACCCG GCTGCGATCT TTTCCTCGTC GTCGGCGCCC CCAATTCTTC GAACTCGAAG 
CGCCTGGTGG AAGTAGCGCT GAGGGCCGGG GCAAAGAAAG CCGTTCTGGT TCAGCGGGCT 
TCTGAAATTG ACTGGGCGAC GATCGGGGAA ATCTCGACCG TCGGGTTGTC CGCCGGTGCC 
TCGGCGCCGG AGGTGATCGT CAATGAGATC ATCGAAGCCT TCCGCGAGCG CTACGACGCC 
GCGGTCGAGC TTGCCGACAC GGTGGAGGAG AACGAGCACT TCCTCGTCAA CCGCGAGCTC 
AGGCATGTCG AACTGACCGG CGCCGACATG GCTTTCGTCA ATGGTGAATA G

Protein sequence

MMASSVAKTP ITIRLCGPRG FCAGVDRAIQ IVVLALKEFG APVYVRHEIV HNRYVVEGLE 
AKGAIFVEEL DEIPPEHRKQ PVVFSAHGVP KSVPADADAR NLFYLDATCP LVSKVHKQAM 
RHHRMGRHVV LIGHAGHPEV IGTMGQLPEG TVSLIETVED VDVYTPPDPD NLGFVTQTTL 
SVDDTAGVIK RLHERFPNLT APAADSICYA TTNRQEAVKQ AAPGCDLFLV VGAPNSSNSK 
RLVEVALRAG AKKAVLVQRA SEIDWATIGE ISTVGLSAGA SAPEVIVNEI IEAFRERYDA 
AVELADTVEE NEHFLVNREL RHVELTGADM AFVNGE