Gene Mlg_0189 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0189
Symbol
ID	4268631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	219441
End bp	221144
Gene Length	1704 bp
Protein Length	567 aa
Translation table	11
GC content	68%
IMG OID	638124913
Product	inner-membrane translocator
Protein accession	YP_741034
Protein GI	114319351
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0559] Branched-chain amino acid ABC-type transport system, permease components
TIGRFAM ID	[TIGR03409] urea ABC transporter, permease protein UrtB

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	46
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGCCT TCATGCGATG GGCGCTGGCA GTCGTGTTGT GTGCCGCCGC CGCGAGCGCG 
TTGGCGGACC AGGAGCTGAC TGCCGAGGAG CGCGCCGCAC AACTGGCGGA GACCGAGGCG 
GACACCGTGG AGGTGGCCGG CGACGGTCTG GCCGAGGAGA CCGCGGAGGC CGTGGCCCGG 
ATGGCCAGCA GCAACTGGCA GGACGTGCGC GACGCCATCA ACCGCCTGGC GGAGCTGAAC 
GACGCCGATG CCCTCCCGGT GCTCCAGGCG CTGCAGGACC GGCGCCTGTT TTACGACCAG 
GACGAGCGCG TGCTGGTGGA GGATGCCCTT ACCGGGCAGC TCCGTGATCC GGTGACCGGC 
GAGGACGTGG AGCGCGAGGG GCTTGATCTG AGCGAACCCC CGCTGACCAA CCCCATCCGC 
CGCAGCCTGC GCCCGGTGAT CGGGCAACTG CAGATCTTCT CCGATGAACT GCCCCTGCGC 
CTGTCGGCCG CCGAAGAACT GGCCGACCGA CCGCAAGCCG CCATGCTGGA TACCCTGCGG 
GAGGCCGTGG AGCAGGAGCA GAACGCCGAG GTGTCCCGCC TGCTCAACAT CGCCATCGCC 
CGGCTGGAAC TGGACGACGA CGATGCCGAG GTTCGCCTGG CCGCCGTCGA GACCATCGCC 
GTGGTGCGCT CCAGCCGCCT GAAATCCCAG CTCCAGCGAC TGCTGGCGGA AGGGCCGGAC 
GGCGAGTACA TCGAACCGGA CGAGCGGGTC CGGGAGGCCG CCCGGGTGGC CATCGAGGCC 
ATCGAGGCCC GGGAGCGGGT GGCCAGCGTG CTCAGCGACC TGGTCTACGG CCTGTCCATG 
GGCAGCGTGC TGCTGCTGGC GGCCCTGGGG CTGGCCATCA TCTTCGGCCT CATGCGGGTC 
ATCAACATGG CCCACGGCGA GCTGCTGATG ATTGGCGCCT ACGTCACCTT CCTGGTGCAG 
AACTTTTTCG TCGCGTTCAT GCCCGGGCTG TTCAACTTCT ACCTGGTGGC GGCGGTGCCG 
GTGGCCTTCA TCGCCACCGC CCTGGTGGGT ATCGCCATGG AACGGGGCGT CATCCGCTTT 
CTCTACAAGC GGCCGCTGGA GACCCTGCTG GCCACCTGGG GCATCAGCCT GATCCTCATC 
CAGACCATGC GCACCCTCTT CGGGGCGCAG AACGTGCGGG TCGCCAGTCC CGAGTGGTTC 
TCCGGCAGCG TGCAGTTGAT GCAGGGGGTC TCCCTGTCCA CCAGCCGCGT GGGGGTGATC 
CTGTTCGCCA TCTTCGTGGT GGCACTGGTC TGGTTCCTGA TGCAGCGCAC CCGGCTGGGC 
CTGGAGGTCC GGGCGGTGAT GCAGAACCGG GAGATGGCCG CCGCCCTGGG CGTCTCCGCC 
AACCGGGTGG ATATGTGGAC CTTCGCCGCC GGCGCCGGCG TGGCCGGCCT GGGGGGCGTG 
GCCCTGTCGC AGATCGTCAA CGTGGGGCCG CAGCTCGGCC AGGCCTACAT CGTGGACAGC 
TTCATGGTGG TGGTGCTGGG GGGCGTGGGC AACGTGATGG GCTCGGTGGT CAGCGCCCTG 
GGCATGGGGG TCTTCTCCAA GTTCCTGGAG CCGGTGACCG GGGCCGTCAT GGCCAAGATC 
CTGCTGTTCA CCGCGATCAT CCTGTTCATT CAGTGGCGTC CCCAGGGCAT CTTCGCCCTC 
AAGGGCCGTT CCGCCGACGA CTGA

Protein sequence

MKAFMRWALA VVLCAAAASA LADQELTAEE RAAQLAETEA DTVEVAGDGL AEETAEAVAR 
MASSNWQDVR DAINRLAELN DADALPVLQA LQDRRLFYDQ DERVLVEDAL TGQLRDPVTG 
EDVEREGLDL SEPPLTNPIR RSLRPVIGQL QIFSDELPLR LSAAEELADR PQAAMLDTLR 
EAVEQEQNAE VSRLLNIAIA RLELDDDDAE VRLAAVETIA VVRSSRLKSQ LQRLLAEGPD 
GEYIEPDERV REAARVAIEA IEARERVASV LSDLVYGLSM GSVLLLAALG LAIIFGLMRV 
INMAHGELLM IGAYVTFLVQ NFFVAFMPGL FNFYLVAAVP VAFIATALVG IAMERGVIRF 
LYKRPLETLL ATWGISLILI QTMRTLFGAQ NVRVASPEWF SGSVQLMQGV SLSTSRVGVI 
LFAIFVVALV WFLMQRTRLG LEVRAVMQNR EMAAALGVSA NRVDMWTFAA GAGVAGLGGV 
ALSQIVNVGP QLGQAYIVDS FMVVVLGGVG NVMGSVVSAL GMGVFSKFLE PVTGAVMAKI 
LLFTAIILFI QWRPQGIFAL KGRSADD