Gene Mlg_2098 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2098
Symbol
ID	4270076
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2377346
End bp	2379013
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	66%
IMG OID	638126854
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_742930
Protein GI	114321247
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	0.249977
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCAGT ACATCTACAC CATGAACCGG GTGAGCAAGA TCGTGCCGCC CAAGAAGACC 
ATCCTTAAGG ACATCTCGCT GTCCTTCTTC CCGGGCGCCA AGATCGGCGT GCTGGGGCTC 
AACGGCTCCG GCAAATCCAC CCTGCTGCGG ATCATGGCCG GTGTGGACCA GGAGTTCGAG 
GGTGAGGCCC GCGCCCAGCC TGGCACCAAG ATCGGCTACC TCCCGCAGGA GCCCCAGCTG 
GACGACAGCA AGGATGTGCG GGGCAACGTC GAGGAGGGCG TGGCCGAGAT CAAGGCACTG 
TTGACCCGCT TCGACGAGAT CTCCGCGAAG TTTGCCGAGC CGGACGCCGA TTTTGAGGCA 
CTGATGGCCG AGCAGGCCAA GCTCCAGGAC CGTATCGATG CCACCGGTGC CTGGGAGCTG 
GAACGCAAGC TCGAACAAGC CGCCGACGCC CTCCGGCTGC CACCCTGGGA GGCGGACGTC 
AGCAAGCTAT CCGGCGGTGA GCGCCGCCGT GTGGCGCTCT GCCGCCTGCT GCTCTCGGCC 
CCTGACATGC TCCTGCTGGA CGAGCCCACC AACCACCTGG ACGCCGAATC GGTGGCCTGG 
CTGGAGCGGT TCCTGGCGGA GTTCCCGGGC ACCGTGGTGG CCGTCACCCA CGACCGCTAC 
TTCCTTGATA ATGTCGCCGG CTGGATCCTG GAGCTGGACC GCGGCCACGG CATCCCCTGG 
GAGGGCAACT ACAGCTCCTG GCTGGAGCAG AAGGAGAAGC GCCTGGAGCA GGAGGCCAAA 
CAGGAGGCCG CCCACCGCCG CAGCATGAAG GCCGAGCTGG AGTGGGTGCG CAGCAACCCC 
AAGGGCCGCC AGGCCAAGAG CAAGGCGCGC CTGGCCCGCT TCGAGGAGCT ACAGAGCCAG 
GAGTTCCAGA AGCGCAACGA GACCCAGGAG CTCTACATCC CGCCGGGTCC GCGCCTGGGC 
AACAAGGTCA TCATCGCCGA TGGCGTCAGC AAGGCCTTTG GCGATCAGCT GCTGTATGAG 
GACCTGAGCT TCAACCTGCC CCCGGGCGGC ATCGTGGGCA TCATCGGCCC CAATGGGGCC 
GGTAAGACGA CGCTGTTCCG CATGATCACC GGTCAGGACG AGCCGGACAG CGGCCGCATT 
GAGGTCGGGG ACACAGTGGA ACTCGCCTAC GTGGACCAGT CCCGCGACAG CCTGGATGGC 
AGCAAGACCG TCTGGGAAGA GATCTCCGAC GGTCTGGATA TCATCAAGGT GGGCAAATAC 
GAGACCCCGT CCCGCGCCTA CGTGGGCCGG TTCAACTTCA AGGGCTCGGA CCAGCAGAAG 
TACATCGGGG ATCTGTCCGG CGGTGAGCGT AACCGCGTGC ACCTGGCCAA GCTGCTCCGC 
AGCGGCGGCA ATACCCTGCT GTTGGACGAG CCCACCAACG ACCTGGACGT GGAGACCCTG 
CGCGCCCTGG AAGAGGCCCT GCTCGCCTTC CCCGGCTGCG CCATGGTCAT CTCCCACGAC 
CGTTGGTTCC TGGACCGGAT CGCCACCCAC ATCCTCGCCT TTGAGGGCGA CAGCCAGGTG 
ACCTGGTTCG AGGGGAACTA CCAGGAGTAC GAGGCGGACC GCAAGAAGCG GCTGGGCGAC 
GAGGCCCTCA ACCCCCACCG TATCAAGTAC CGGCGATTGG GGACCTGA

Protein sequence

MAQYIYTMNR VSKIVPPKKT ILKDISLSFF PGAKIGVLGL NGSGKSTLLR IMAGVDQEFE 
GEARAQPGTK IGYLPQEPQL DDSKDVRGNV EEGVAEIKAL LTRFDEISAK FAEPDADFEA 
LMAEQAKLQD RIDATGAWEL ERKLEQAADA LRLPPWEADV SKLSGGERRR VALCRLLLSA 
PDMLLLDEPT NHLDAESVAW LERFLAEFPG TVVAVTHDRY FLDNVAGWIL ELDRGHGIPW 
EGNYSSWLEQ KEKRLEQEAK QEAAHRRSMK AELEWVRSNP KGRQAKSKAR LARFEELQSQ 
EFQKRNETQE LYIPPGPRLG NKVIIADGVS KAFGDQLLYE DLSFNLPPGG IVGIIGPNGA 
GKTTLFRMIT GQDEPDSGRI EVGDTVELAY VDQSRDSLDG SKTVWEEISD GLDIIKVGKY 
ETPSRAYVGR FNFKGSDQQK YIGDLSGGER NRVHLAKLLR SGGNTLLLDE PTNDLDVETL 
RALEEALLAF PGCAMVISHD RWFLDRIATH ILAFEGDSQV TWFEGNYQEY EADRKKRLGD 
EALNPHRIKY RRLGT