Gene Mlg_0018 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0018
Symbol
ID	4269549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	21528
End bp	22703
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	71%
IMG OID	638124745
Product	hypothetical protein
Protein accession	YP_740867
Protein GI	114319184
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0100534
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCAT TGCGAGCTAT GAATGCCCTG CACCCCACAC TGTTTCTGGT GCTTGCCCTG 
ACGGCAGTCA TTGCGCTCCC CGGCTGCGGT GCCATGCAAC GCCATTACGA GGCGGGGCTG 
ATCCTGGCCG ATATCCGCGC CGGCGAGGCC GACAGCCGCT GGAAACGCAC CCGACCGGCC 
CCGGAACGAG AGACCGTCGA GTACACCGGC CCCACCGGGG TGCCACGGGT GGCCGACCTC 
TATACCCCGG GCGACGAGGT CCGCTCCAAC CTGGTGCTGG TCCACGGCTT CACCGAGGCG 
GGCCGGCGGG ACCCGCGCCT GGTGCAGTTC GCCAAGACGC TGAGCCGGGC CGGTTTTCGC 
GTCCTCGCCC CAGAGGTGGA GACCCTCACC CGCATGGACG TCTCGCCGGA GAACATCCGC 
GATGTGGTGG ATGCCGCCCA CTGGCTGGAC GCGCGGGACG ACGGCGAGGG GGTGGGCGTG 
GCCGCGATGA GCTTCTCCGT CGCCACCGCC GTGCTGGCGG CGCTGGAGGA GGACGGCCGG 
CCACACATCG GCTGGATCGT CGGGGTGGGC GGCTACTACG ATCTGGTGGA GACCCTGACC 
TACGTCACCA CCGGCTATTT CACCGAGGAC GGCGAGCGGC GCTACCAGAT CCCCCGGGTG 
GAGGGCCGCT GGGTGGTCCT GCTGACCCAG CTGGACCGGG TGCCGGATGC CGACGACCGC 
CGCCTGCTCG ACCGTATCGC CCGCGAGCGC CTGGCGGACC CGGAGGCCGA GACCGGGCCG 
CTGGCCGAGC GGCTGTCACC GCCCGGGCGC GCGGTCTATG CCTTGCTCAC CAACCGGGAT 
CCGGATCGGG TACCGGACCT GCTGGCGGCG TTGCCCGACG GCGTCCGCGA CGAGATTAAA 
GCGCTGAATC TTGCCAACCG GGACCTGTCC CGGCTTCAGG CCTACCTGCT GCTGGTCCAC 
GGCCGCGACG ACGATGTCAT CCCCTGGACC CAGAGCCAGG CCCTCAAGCA GGCCGCCCCC 
AGGGGGCAGG CCGAGTTGCG GCTGGTGACC GGCCTCACCC ATGTGGATGT GGACCCCGGG 
GTGGTGGGCG CCTGGCGGTT GCTGCGGGCG GTCAACCGGC TGCTGTTGCT GCGCGACGAC 
CCGCCACCGA CCCCCTCGTC GGCGAATGAG CCATGA

Protein sequence

MPSLRAMNAL HPTLFLVLAL TAVIALPGCG AMQRHYEAGL ILADIRAGEA DSRWKRTRPA 
PERETVEYTG PTGVPRVADL YTPGDEVRSN LVLVHGFTEA GRRDPRLVQF AKTLSRAGFR 
VLAPEVETLT RMDVSPENIR DVVDAAHWLD ARDDGEGVGV AAMSFSVATA VLAALEEDGR 
PHIGWIVGVG GYYDLVETLT YVTTGYFTED GERRYQIPRV EGRWVVLLTQ LDRVPDADDR 
RLLDRIARER LADPEAETGP LAERLSPPGR AVYALLTNRD PDRVPDLLAA LPDGVRDEIK 
ALNLANRDLS RLQAYLLLVH GRDDDVIPWT QSQALKQAAP RGQAELRLVT GLTHVDVDPG 
VVGAWRLLRA VNRLLLLRDD PPPTPSSANE P