Gene Mlg_1160 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1160
Symbol
ID	4270666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1358659
End bp	1360101
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	71%
IMG OID	638125909
Product	molybdopterin biosynthesis protein MoeB
Protein accession	YP_741999
Protein GI	114320316
COG category	[H] Coenzyme transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0476] Dinucleotide-utilizing enzymes involved in molybdopterin and thiamine biosynthesis family 2 [COG0607] Rhodanese-related sulfurtransferase [COG1977] Molybdopterin converting factor, small subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.284227
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA CCAGCGTAAC CGTGCGCCTG CCGGCGCCGT TGCGGCCCTT CGCCGGGGAC 
CAGCCGGAAC TGCACGTCCC GGGCGCCAGC GTGGGCGAGG TGCTCGAGGC CCTGGCCCGC 
GACTACCCGC TGCTGCACGC CCGTCTGGTG GATCCGGACG GCGAGTTGCG GGCCTTCGTC 
AATCTTTTCC GGGGTGAGCA GGACGTACGG GAGCTGGCGG GGCAGAGGAC GCCGCTGCGG 
CCGGGCGATG TGCTGACCGT GTTGCCGGCG GTGGCCGGCG GGGCGCCCTC CGCCCTGGAG 
CGCCTCTCGG CGCGGATTCG CCGGGAGGTG CCGGAGGTCA CACCGGCGGA GGCGCAGAAG 
CTGGCGGCGC AGGGGGCAGT GCTGCTGGAT GTGCGGGAGG CCGGGGAGGT GGCAGAGGGC 
AGCCCCACCG GCGCGCTGCG CATCGACCGC AACTGGCTGG AGTTGCGCAT CGAGGAGGCG 
GTGCCCGAGC CGGAACGGCC CATCCTTACC CTGTGCGCCG TGGGACAGCG CTCGCTGCTG 
GCGGCGGACG ACCTGCGTCG CCTGGGCTAT CGCGACGTGC GCAACATCGC CGGCGGCTTT 
AACCGCTGGA AGGACGAAGG CCTGCCCTTC GAGGTGCCGC GGGTGCTGGA TGACGCCTCG 
CGGGCCCGCT ACGCCCGCCA CCTGCGCATG CCCGAGGTGG GTGAGGCGGG GCAGCTGCGC 
CTGGGCGAGA GCCGGGTGGT GCTGGTGGGG GCCGGAGGGC TGGGTTCGCC GGCGGCGCTC 
TATCTGGCCG CGGCCGGGGT GGGCACCCTG GTGCTGGTCG ACCATGACGT GGTGGACCGC 
AGCAACCTGC AGCGCCAGAT CCTGCATACC GACGACCGGG TCGGCCAGCC CAAGACGGAG 
TCCGGGCGGC AGGCGGTGGC CGCGCTTAAC CCCCAGGTGC GCGTGGAGGC CGTCCAGGCC 
CGGCTGAACA GCGAGAACAT CGAGGCCGTG CTCGCCGGCG CCGACTTGGT GATCGACGGC 
TCAGATAACT TTCCCACCCG CTACCTGGTC AATGACGCCT GCGTGAAACT GGGCCTGCCG 
CTGGTCTACG GCGCGGTCTA CCGGTTCGAG GGTCAGGTCA CGGTGTTCAA TGTGGATGAC 
GGGCCCTGCT ACCGCTGCCT CTATCCGGAG CCGCCCCCGG CGGAGCTGGC CCCATCCTGT 
GCCCAGGCCG GGGTGCTGGG CGTGCTACCG GGGGTGATTG GGCTGCTGCA GGCCACGGAG 
GCGGTCAAGC TCCTGCTGGG TGTGGGGGAG CCGCTGTCCG GTCGACTGGT GCACTACGAT 
GCGCTGCGGG GGCAGTTTCA GCAATTGCGG ATGAAGGCCA ACCCCGATTG CCCCGTTTGC 
GCCCCCGGGC GTCCGTTCCC AGGTTATGTG GACTACGAGG CCTTCTGCAG CAGTTCGGCC 
TGA

Protein sequence

MSETSVTVRL PAPLRPFAGD QPELHVPGAS VGEVLEALAR DYPLLHARLV DPDGELRAFV 
NLFRGEQDVR ELAGQRTPLR PGDVLTVLPA VAGGAPSALE RLSARIRREV PEVTPAEAQK 
LAAQGAVLLD VREAGEVAEG SPTGALRIDR NWLELRIEEA VPEPERPILT LCAVGQRSLL 
AADDLRRLGY RDVRNIAGGF NRWKDEGLPF EVPRVLDDAS RARYARHLRM PEVGEAGQLR 
LGESRVVLVG AGGLGSPAAL YLAAAGVGTL VLVDHDVVDR SNLQRQILHT DDRVGQPKTE 
SGRQAVAALN PQVRVEAVQA RLNSENIEAV LAGADLVIDG SDNFPTRYLV NDACVKLGLP 
LVYGAVYRFE GQVTVFNVDD GPCYRCLYPE PPPAELAPSC AQAGVLGVLP GVIGLLQATE 
AVKLLLGVGE PLSGRLVHYD ALRGQFQQLR MKANPDCPVC APGRPFPGYV DYEAFCSSSA