Gene Mlg_0542 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_0542
Symbol
ID	4268071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	590079
End bp	591404
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	67%
IMG OID	638125283
Product	membrane protein
Protein accession	YP_741386
Protein GI	114319703
COG category	[S] Function unknown
COG ID	[COG3174] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.00215324
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCCGCGAC AGGGAGGGGC CCGCCCCGGG CCACAGCCGC CAGCAATGGA AGAACTCACC 
GAGCAGTTCA TCGCCGGCAA CGAAACCATC CTGCAGTTGG CTGTGGCACT GCTGCTGGGC 
GCGCTCATCG GTCTGGAGCG CGGTTGGGAA TCGCGGGAGC TGGCCGCCGG GCGCCGGGTG 
GCAGGGATCC GCACCTATGC CCTGCTCGGG CTGTTGGGTG GCCTGTCGGC GGTGCTTTCC 
GAGGCCCTCA GCCCCTGGGC CTTCCCGGTG ATGCTGATCG GCGTGGCGGC GCTGACGCTG 
GTGGCCTACC GCACCCAGGC GGAGCAGGAG CGCAACGTCA GTATCACCGG CGCGGTGGGC 
CAGATACTCA CCTTCTCGTT CGGGGCGATC GCGGTGGCGG TGGACATGGT GGTGGCCACC 
GCGGGCGCAG TGGTCACGGT GCTGATCCTG GACAACAAGC GGGAGATCCA CGGCCTGATC 
AACCAGCTTC ATGCCCATGA GCTGGACGCG GCCTTCAAGC TGCTGTTGAT CTCCGTGGTC 
ATGCTGCCCC TGCTGCCGGA CGAGGGCATG GGCCCCGGCA GGGCCATCAA CCCTTACGAG 
ATCTGGTGGC TGGTGGTGTT GATCGCCTCG GTCTCCTTCG TCGGCTACTT CGCCGTCCGG 
GTCGGCGGCA CCGAGAAGGG GATCCTGTTC ACCAGCCTGT TCGCGGGGCT GAGCTCCTCC 
ACCGCGCTGA CCCTGCACTT CTCCCGACAG TCGCGCCAGG CCGCCGAACT CAGCCCACTG 
CTGGCCGCCG GCATCCTCAT CGCCTGCGGC ACCATGTTCC CGCGCATCCT GCTCTATGCG 
CTGATCATCA ATCCGGCACT GATCCCGGCG CTGGTGCTGC CGGTCATCGT CATGGCCACC 
CTGCTCTACC TGCCCGCGCT GGTCATCTGG CACCGGCAAC GCCGGCGCCA GGACGTGGCC 
CAGCCGACCC TAAAACAGAA CCCGCTGGAT CTGAAGTCGG CGTTGATGTT CGGTGCCTTG 
CTCACCGCCA TCATGTTCCT CGGTGAATGG CTGCGGGAAT GGCTGGGGGA CGCCGGCATC 
TATCTGCTGG CCGCCTCCTC CGGGGTGGCG GACGTGGACG CCATCACGTT GTCGTTGACC 
CGGATGTCCA ACGTCTCCAT CACCCTGGAC ACGGCGGTGA TGGGCATCGT CATCGCCGCC 
TCGGTGAACA ACCTGATCAA GGGCGGCCTG GCCGCGGTGA TCGGCACCGG CGCGCTGGGC 
AAACGGGTCA CCGGTCCCAT GCTGTTGTCG CTGGCCGCCG GGCTGGCCGT GGCTTGGTGG 
CAATAG

Protein sequence

MPRQGGARPG PQPPAMEELT EQFIAGNETI LQLAVALLLG ALIGLERGWE SRELAAGRRV 
AGIRTYALLG LLGGLSAVLS EALSPWAFPV MLIGVAALTL VAYRTQAEQE RNVSITGAVG 
QILTFSFGAI AVAVDMVVAT AGAVVTVLIL DNKREIHGLI NQLHAHELDA AFKLLLISVV 
MLPLLPDEGM GPGRAINPYE IWWLVVLIAS VSFVGYFAVR VGGTEKGILF TSLFAGLSSS 
TALTLHFSRQ SRQAAELSPL LAAGILIACG TMFPRILLYA LIINPALIPA LVLPVIVMAT 
LLYLPALVIW HRQRRRQDVA QPTLKQNPLD LKSALMFGAL LTAIMFLGEW LREWLGDAGI 
YLLAASSGVA DVDAITLSLT RMSNVSITLD TAVMGIVIAA SVNNLIKGGL AAVIGTGALG 
KRVTGPMLLS LAAGLAVAWW Q