Gene Mlg_0559 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0559
Symbol
ID	4270314
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	607309
End bp	608427
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	71%
IMG OID	638125300
Product	permease YjgP/YjgQ family protein
Protein accession	YP_741403
Protein GI	114319720
COG category	[R] General function prediction only
COG ID	[COG0795] Predicted permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.298895
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.00000418027
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

TTGTCGCCCA TCCGCATTCC CGTCGTCGAT CGCTACCTGG TGCGCGAGGT GTTGTTCGCC 
TGGCTGGCGG TGCTGTTGGT GCTGTTCGCG GTGCTGGCGA CCAACCGGCT GATCGGCTAT 
CTGGGCGATG CCGCCGGTGG CGAACTGCCC GGTGGGGTCA TCCTCACCCT GCTGGGCCTG 
CAGACGGTTC GCTATCTGGG CATGATTCTG CCCGCCAGCT TCTTTCTGGG CATCGTCCTC 
GCCTTTGGCC GGCTCTACCG GGACAGCGAG ATGGCGGTGA TGTCCGCCTG CGGGATCGGG 
CCCTGGCGGC AGTTTCGCGC GCTGCTCTGG TTGGCCCTGC CGCTGGCAGG GCTGGTGGGG 
CTGCTGTCGC TGTACTGGGG GCCGGCGGCG ACCCAGAAGG CGGAGCAGGT GCAGGCCGAG 
GCGGAGGCCC AGGTGGAGTT CGCCGCCCTG CAGGCCGGCC GTTTCCTGCA GGCGCGCGGG 
GCCACCGAAG GAACGCTCTA CCTGGAACGG CTCAGCGAAG ACCAGCGCGA GATGGAGGAC 
GTCTTCATCC GCGCCGGTGG CACCGCGGAC CGGGTGGTCC TGGCGGCCCG GCGCGGGGTA 
CAGGAGAAGG ACCCGGAGAC CGGTGACCGC TACCTGGTGC TGCTGGATGG CTGGCGTTAC 
GACGGCCGAC CGGGCGCTGC GGACTGGCGG GTGACCCGCT TCGAGCGCCA CGGGGTCCTG 
GTGGCGGAGG GTTCGGAGGA GGTGGCCGTG CGCCTGCGCC GCAATGCTCA GCCCACCGCC 
GAGCTGTGGG GTTCCGACCA TCCGGCCGAC CGGGCCGAGG TGCAATGGCG GCTGGCGATG 
CCGGCCATGA CCCTCCTGCT GGCGCTGCTG GCGGTGCCGC TCAGCAAGAG CGCGCCGCGG 
GACGGGCGTT ACGGGCGCCT GCTCTCTGCC GTGTTGGTCT ATGTGGGCTA TTTCCAGTTT 
CTGACCGTGG GCCAGGATTG GCTGGAGACG GGCCAGGTCC CGGCTGCCCT TGGGCTCTGG 
TGGTTGCATG GGGCGGTGCT GGCCGTGGGC GTGCTGGGCC TGCTCTGGCG CTTCGACCTG 
CTGCCCGCGC GTGGCGGGCA CAAGGGGCGG GCACCATGA

Protein sequence

MSPIRIPVVD RYLVREVLFA WLAVLLVLFA VLATNRLIGY LGDAAGGELP GGVILTLLGL 
QTVRYLGMIL PASFFLGIVL AFGRLYRDSE MAVMSACGIG PWRQFRALLW LALPLAGLVG 
LLSLYWGPAA TQKAEQVQAE AEAQVEFAAL QAGRFLQARG ATEGTLYLER LSEDQREMED 
VFIRAGGTAD RVVLAARRGV QEKDPETGDR YLVLLDGWRY DGRPGAADWR VTRFERHGVL 
VAEGSEEVAV RLRRNAQPTA ELWGSDHPAD RAEVQWRLAM PAMTLLLALL AVPLSKSAPR 
DGRYGRLLSA VLVYVGYFQF LTVGQDWLET GQVPAALGLW WLHGAVLAVG VLGLLWRFDL 
LPARGGHKGR AP