Gene Mlg_2271 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2271
Symbol
ID	4268234
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	2575419
End bp	2576510
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	66%
IMG OID	638127028
Product	binding-protein-dependent transport systems inner membrane component
Protein accession	YP_743103
Protein GI	114321420
COG category	[R] General function prediction only
COG ID	[COG4174] ABC-type uncharacterized transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGGGGT ATGTCGCCCG GCGCCTGCTG CTCATGATCC CGACCCTGCT TGGGATCATG 
GTCATCAACT TCGCCATCGT GCAGTTCGCC CCCGGCGGGC CCATCGAGCG GATCGCCGCC 
CAGGTGCAGG GCAGCATGGC GGATGCCACC GGTCGCTTTA CCGGGGTGGA TGCCCGCGAG 
GCGGGCGACG CCACCGGGAT GGCCGACGAG GTCTCCCGTG GCGCCCGCGG CCTCCACCCG 
GAGTTCATCG CCGAGTTGGA GGCGCAGTTC GGCTTCGACC GGCCCGCCCA CGAGCGCTTC 
CTGCAGATGA CCTGGAACTA CCTGCGGTTC GACTTCGGCG AGTCGTTCTA CGCCGACCGG 
ACCGTCATCG AGCTGATCCG CGATCGGCTG CCGGTCTCCA TCTCCCTGGG CCTGTGGACC 
ACCGTGCTGG TCTACCTCAT CTCCATCCCC CTGGGCATCC GCAAGGCGGT GCGCGACGGC 
AGCCGCTTCG ATCTCACCAC CTCGGCGGTG GTCTTTGTCG GCTACGCCAT CCCCAACTTC 
CTGTTTGCCA TCCTGCTCAT CGTGCTCTTC GCCGGCGGCT CCTGGCTGGA TCTCTTCCCG 
CTGCGGGGGC TGGTCTCCGA CAACTGGCAC GATTTGAGCT GGCCCATGCG CATCCTCGAC 
TACCTGCACC ACATCACCCT GCCGGTGCTG GCCATGGTGA TCAGCGGTTT CGCCGGGCTG 
ACCATGCTCA CCAAGAACAG CTTCCTGGAG GAGGTGAACA AGCAGTACGT GATGACCGCC 
CGTGCCAAGG GCTGCACCGA GCGCGGCGTG CTCTATGGCC ACGTCTTCCG CAACGCCATG 
CTCATCGTTA TTGCCGGCTT CCCGGCCGCC TTTATCGGCA TCCTCTTTAC CGGGGCGTTG 
CTGATTGAGG TGATCTTCTC CCTGGACGGG TTGGGGCTGC TGGGCTTCGA GGCGGTGGTG 
AACCGGGACT ACCCGGTGGT CTTCGGCACC CTGTTCATCT TCACCCTGCT CGGGCTGGTG 
CTGAACCTCA TCGGCGACCT GATGTACGTG GCCATCGACC CGCGGATCGA CTTCGAGCGG 
AGGGCGGGCT GA

Protein sequence

MWGYVARRLL LMIPTLLGIM VINFAIVQFA PGGPIERIAA QVQGSMADAT GRFTGVDARE 
AGDATGMADE VSRGARGLHP EFIAELEAQF GFDRPAHERF LQMTWNYLRF DFGESFYADR 
TVIELIRDRL PVSISLGLWT TVLVYLISIP LGIRKAVRDG SRFDLTTSAV VFVGYAIPNF 
LFAILLIVLF AGGSWLDLFP LRGLVSDNWH DLSWPMRILD YLHHITLPVL AMVISGFAGL 
TMLTKNSFLE EVNKQYVMTA RAKGCTERGV LYGHVFRNAM LIVIAGFPAA FIGILFTGAL 
LIEVIFSLDG LGLLGFEAVV NRDYPVVFGT LFIFTLLGLV LNLIGDLMYV AIDPRIDFER 
RAG