Gene Mlg_1045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1045
Symbol
ID	4270518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1195795
End bp	1197279
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	69%
IMG OID	638125797
Product	hypothetical protein
Protein accession	YP_741888
Protein GI	114320205
COG category	[S] Function unknown
COG ID	[COG0397] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.0432954
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGCAG AACCTATCTG GCCCTTTGAC AACAGTTACG CCCGGCTGCC CGAGCGCTTC 
TTTGCCCGTG TGCGGCCGAC CCCGGTGGCA CAGCCCGGTC TGGTGCGGCT CAACGAGCCT 
CTGGCCGAAG CATTGGGGCT GGAGGTGGCG GCCTTACGCG GTAAGGCGGG CCTGGCGATG 
TTCGCCGGCA ACCGTCTGCC TGAGGGGGCG GAACCCATCG CCCTGGCCTA TGCCGGCCAC 
CAATTCGGGC AGTGGGTGCC GCAACTGGGT GATGGCCGGG CGGTGCTGTT GGGCGAGGTA 
GTGGACAGGG ACGGCCGGCG CCGGGACATT CAGCTCAAGG GCTCCGGCAT CACCCCCTTC 
TCCCGGGGTG GTGACGGGCG GGCGCCCATC GGACCGGTGG TCCGCGAATA CCTGGCGAGC 
GAGGCCATGC ACGCCCTGGG CATCCCCACC ACCCGCTCGC TGGCGGCGGT GACCACCGGG 
GAGCCGGTGC TGCGCGAGCG GGTGGAGCCC GGCGGCATCC TCACCCGGGT GGCGCACAGC 
CATGTGCGGG TGGGCACCTT CGAGTACTTC CACTGGCGGG AGGATGTCGA CGCCCTGAGG 
ACCCTGGCCG ATTACGTTAT CGCCCGCCAT TACCCGGAAC TGGCAGACGA CGCGCGGCCC 
CATCTCGCGT TATTGAAGGC GGTGATCGAT CGCACTGCCG AGCTGGTGGC CCACTGGATC 
AGCGTGGGCT TCATCCACGG GGTGATGAAC ACCGATAACA CCTCGCTGGT GGGCGAGACC 
CTGGATTACG GGCCCTTCGG CTTCCTGGAC GCCTACCACC CCAGGACCTG CTACAGCGCC 
ATCGACATTG AAAACCGTTA CGCCTTCGAC CAACAGCCGC GGATCGCGCA CTGGAACCTC 
ACCCGGTTGG CGGAGACCCT GCTGCCATTG CTGCACGAGG ATGAGGACGA GGCCGTGGCG 
CGGGCCGGGG AGGCGCTGAA CGGCTTCCTC CCGCGCTTCG AGGCCTGCCA CCATGCCCGA 
CTGCGGGCCA AGCTGGGCCT TGCCGAAAGC CGCCGCGGGG ACATCGACCT GGCGCACGAG 
TTGCTTGATC TCATGGCTCG GCAACAGGCG GACTTCACCC AGGTCTTCCG CGCCCTTTCC 
GACGAGCGGA TGGATGATCC CGACGAAGGG CCCGCCCGAC GCTGCTTCGC CCGGCCCGAG 
GCCCTGGATG GCTGGCGCGC ACGCTGGATC CAGCGATTAC GCCAGGAGGG ACGGCCGGAG 
CCGGCACGCC AGGCCGCCAT GCGGGCGGTA AACCCCAAGT TCATCCTGCG CAACCACTTG 
GCCCAATGGG CGGTGGATGC CGCCACCGAG CGGGGGGATT TCGGCCCCAT GGACCGGCTG 
CTGCAGGTGC TGACCCGCCC CTACGACCCG CAGCCGGAGG CGGAGGCACT GGCCGCCCCG 
CCCCGGCCGG AGCAGCAGGT CTATCAGACC TTCTGCGGTA CCTGA

Protein sequence

MPAEPIWPFD NSYARLPERF FARVRPTPVA QPGLVRLNEP LAEALGLEVA ALRGKAGLAM 
FAGNRLPEGA EPIALAYAGH QFGQWVPQLG DGRAVLLGEV VDRDGRRRDI QLKGSGITPF 
SRGGDGRAPI GPVVREYLAS EAMHALGIPT TRSLAAVTTG EPVLRERVEP GGILTRVAHS 
HVRVGTFEYF HWREDVDALR TLADYVIARH YPELADDARP HLALLKAVID RTAELVAHWI 
SVGFIHGVMN TDNTSLVGET LDYGPFGFLD AYHPRTCYSA IDIENRYAFD QQPRIAHWNL 
TRLAETLLPL LHEDEDEAVA RAGEALNGFL PRFEACHHAR LRAKLGLAES RRGDIDLAHE 
LLDLMARQQA DFTQVFRALS DERMDDPDEG PARRCFARPE ALDGWRARWI QRLRQEGRPE 
PARQAAMRAV NPKFILRNHL AQWAVDAATE RGDFGPMDRL LQVLTRPYDP QPEAEALAAP 
PRPEQQVYQT FCGT