Gene Franean1_0845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0845
Symbol	ispH
ID	5669261
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	991412
End bp	992428
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	67%
IMG OID	641239774
Product	4-hydroxy-3-methylbut-2-enyl diphosphate reductase
Protein accession	YP_001505209
Protein GI	158312701
COG category	[I] Lipid transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0761] Penicillin tolerance protein
TIGRFAM ID	[TIGR00216] (E)-4-hydroxy-3-methyl-but-2-enyl pyrophosphate reductase (IPP and DMAPP forming)

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.63897
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCGCT CGCCGCTCTT CCAGCCTCGC CGCTCCCGCG TAGACTGCTG CGACATGGGG 
CGGGTCTTGT TGGCCAAGCC GCGCGGCTAC TGCGCGGGTG TCGATCGCGC GGTCCAAACC 
GTCGAGAAGG CACTCGATCT GTACGGGTCG CCGGTGTATG TACGCAAGCA GATCGTGCAC 
AACGCTCACG TCGTCAAGAC GCTGGAAGCG AAGGGCGCGA TCTTTGTCGA AGAGACCGAC 
GAGGTGCCTC ACGGCGCCAC GGTGGTGTTC TCGGCGCACG GCGTGGCACC GACGGTCCAC 
GAGGAGGCTT CCTCGCGTCA GCTTCGCACC ATTGACGCGA CGTGCCCCCT CGTTACCAAG 
GTCCACTCCG AGGCTCGCCG GTTCGCCAAG GAGGATCTGG ACATCCTCCT CATCGGTCAT 
GAGGGCCACG AGGAGGTAGT AGGCACCACC GGCCAGGCGC CGGACCGTAT CCATCTGGTC 
GACGGTCCTG AGGACGCCGC CGCTGTGAAG GTCCGGGACC CGAAGCGGGT CGCGTTCCTC 
TCGCAGACGA CGCTCTCGGT CGACGAGACG CAGACAACGG TCAAGGCGCT TCGCGAGCGG 
TTCCCGCATC TACAGGGGCC GCCGAGCGAC GACATCTGCT ACGCCACCCA GAACCGCCAG 
GTGGCCGTCA AGGAGATCGC CGAGAAGGTC GACCTGCTCA TCGTGGTCGG CTCGCCGAAC 
TCCTCCAACT CGGTCCGGCT CGTCGAGGTC GCCCTCGACG CCGGTGCACC CAAGTCGTTC 
CTCGTGGACG ACTGCTCCGA GGTGGATGAG GGCTGGCTCG ACGGTGTCGA GACGGTTGGT 
GTGACGAGCG GGGCGTCCGT CCCCGAGGAA CTCGTCACCG GGGTCATGGC GTGGCTGGCG 
GACCGCGGGT TCAACGACGT CGAGGAAGTC ACCTCGGCGG ACGAGCACCT GCTGTTCGCG 
CTCCCGCCGG AACTGCGTCG CGACATGCGT GCCCGGGAGC GGGCCGCGGG CGCCTGA

Protein sequence

MLRSPLFQPR RSRVDCCDMG RVLLAKPRGY CAGVDRAVQT VEKALDLYGS PVYVRKQIVH 
NAHVVKTLEA KGAIFVEETD EVPHGATVVF SAHGVAPTVH EEASSRQLRT IDATCPLVTK 
VHSEARRFAK EDLDILLIGH EGHEEVVGTT GQAPDRIHLV DGPEDAAAVK VRDPKRVAFL 
SQTTLSVDET QTTVKALRER FPHLQGPPSD DICYATQNRQ VAVKEIAEKV DLLIVVGSPN 
SSNSVRLVEV ALDAGAPKSF LVDDCSEVDE GWLDGVETVG VTSGASVPEE LVTGVMAWLA 
DRGFNDVEEV TSADEHLLFA LPPELRRDMR ARERAAGA