Gene Mlg_0516 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0516
Symbol
ID	4268868
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	562981
End bp	564024
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	72%
IMG OID	638125257
Product	phosphoribosylaminoimidazole synthetase
Protein accession	YP_741360
Protein GI	114319677
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0150] Phosphoribosylaminoimidazole (AIR) synthetase
TIGRFAM ID	[TIGR00878] phosphoribosylaminoimidazole synthetase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	0.706713
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTCCGG ATCAGGAAGG CCTCACCTAC AAGGCGGCCG GCGTCGACAT CGACGCTGGC 
AACGAACTGG TCGATCGCAT CCGCGACGAC GTCAAGCGTA CCATGCGGCC CGGGGTGCTG 
GGCGGCCTGG GCGGTTTCGG CGGGCTGTTC GAGGTGCCGG TGGACCGCTA CCGCCGCCCG 
GTGCTGGTCT CCGGCACCGA CGGCGTGGGC ACCAAACTGA AGCTGGCCAT CGAGACCGGC 
CGGCACGACG GCATCGGCAT CGACCTGGTG GCCATGTGCG CCAACGATGT GCTGGTCACC 
GGCGCCGAAC CGCTCTACTT CCTCGATTAC TACGCCACCG GCCGGCTGGA CGTGGAGGTG 
GCCGCGGCGG TGATCCGCGG CATCGCCGAG GGCTGCCACC AGGCCGGCGC GGCGCTGATC 
GGCGGCGAGA CGGCGGAGAT GCCCGGCATG TATGCCGAGG GCCACTACGA CCTGGCCGGC 
TTCTGCGTCG GGGTGGTGGA AAAGGACGAG ATCATCGACG GCAGCCGCGT CGGCGCCGGT 
GACGCGCTGA TCGCCCTGGC CGCCTCCGGG CCCCACTCCA ACGGCTACTC GCTGATCCGC 
AAGGTGCTGG AGCGCGCCCC GGAAGGCGCC GCCACCGAGG TGGACGGCCA GCCGGTGGCG 
GACCTGCTGA TGGCCCCGAC CCGGATCTAC GCCAAGCCGG TGCTGGACCT GATCCGCAAT 
CTGCCGGTGC ATGCCATGGC CCACATCACC GGGGGTGGCC TGCCGGAGAA CCTGCCCCGG 
GTGCTGCCCG AGGGCCTGGG CGCCAAGCTG CAACCCTGGA GCTGGCCGCC CGTCTTCCGC 
TGGCTGCAGC AGACCGGTCA GATCGCCGAG GCGGAGATGC TGCGCACCTT CAACTGCGGC 
GTGGGCATGG TGCTGGTGGT GCCGGCCGAG CAGGCGGACG CCGCACTGCA ACGCCTCCGC 
CAGACCGGCG AGACGGCCTG GCGGCTCGGC GAGATCGGCA CGCACGAGGC CGGGGCGCCG 
CGGGTCCAGG TGGTGGCGGC ATGA

Protein sequence

MGPDQEGLTY KAAGVDIDAG NELVDRIRDD VKRTMRPGVL GGLGGFGGLF EVPVDRYRRP 
VLVSGTDGVG TKLKLAIETG RHDGIGIDLV AMCANDVLVT GAEPLYFLDY YATGRLDVEV 
AAAVIRGIAE GCHQAGAALI GGETAEMPGM YAEGHYDLAG FCVGVVEKDE IIDGSRVGAG 
DALIALAASG PHSNGYSLIR KVLERAPEGA ATEVDGQPVA DLLMAPTRIY AKPVLDLIRN 
LPVHAMAHIT GGGLPENLPR VLPEGLGAKL QPWSWPPVFR WLQQTGQIAE AEMLRTFNCG 
VGMVLVVPAE QADAALQRLR QTGETAWRLG EIGTHEAGAP RVQVVAA