Gene Mlg_1694 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1694
Symbol
ID	4268789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	1934891
End bp	1935973
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	70%
IMG OID	638126452
Product	hypothetical protein
Protein accession	YP_742530
Protein GI	114320847
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.258631
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACCCG GGATGAACAC TGAGAACGAG GCGCTCCCGC CGTTGGCGGC GCCGGATCAG 
ACGCTGTCCA CCTGGCACTG GCTGCTGGGG GGCGCAGCGC TGGTGGTTTT GCTGGCCGGG 
CTGAAGGCCG CCGCCGGGGT GGTGACCCCG TTGTTGCTGG CGGCCTTCCT GGCCATCATC 
TGCGCGCCGC CGCTGACCTG GATGCGGCGG CGCGGGGTCC CGGGGTCGGT GGCCGTGTTG 
GCGCTGTTTG TTGCCGTCGG GCTGGCCTTC TTCCTGCTCT TTCTGGCCCT TCAGGGGGCG 
GTGGAGAGCA TGGCGCACCA GGCGCCGCAC TACCAGGCGC GCCTGTTCGG CCTGTTCGAT 
GAGACCATGG CCTGGTTGGC GGGGCGCGGG GTCCCGGCCG AATTGTTGCC GGATCGGCCG 
CCGCTGCCGG CGCTGGCCGA CCTGACCGGG CTGGCGCGGG CGGTGGCGGG GGGCGTGGGC 
CAGTTCACCG CGACCACCTT CCTGGTGCTG TTGGCCTTCA TGTTCCTCCT GCTTGAGGAG 
ACCCACCTGC CCGGGAAGCT GCGGGCGGCC TTCCCCCGCT CCCGCCGAGG CGGGGTGCGG 
GCGCGCCGGT TCCTGCGCTC GGTCTATCGC TATCTCTTCA TCAAGAGTGC GACCAGCCTG 
GCCACCGGCC TACTGGTCGG GGTGGGGTTG GCGCTGATCG GGGTGGATTT CCCGGTGCTC 
TGGGGGATCC TTGCCGGCCT GCTCAACTTC ATCCCGACGG TCGGATCGAT TCTCGCCGCC 
ATCCCGGCAG TCCTGATCGC GTTCCTGGGT CTGGGGGTGA TGGAGGGGCT GCTGGCCCTG 
GCCCTCTACG TGGCCGTCAA TGTGGTCATC GGTAGCGTGC TGGAGCCGCG CTTCATGGGC 
CATACCCTGG GCTTGTCGCC GCTGGTGGTG CTGGTCTCAC TGATGGCCTG GGGCTGGGTG 
TTGGGGCCGG TGGGGATGCT GCTGTCCATT CCCCTGACCA TGATCGCCAA GCTGGCGCTG 
GAGGCGCAGC CCGGGACCCG CTGGCTGGCG ATCATGATGA GCGACCGGGC CCGCGGCCAC 
TGA

Protein sequence

MPPGMNTENE ALPPLAAPDQ TLSTWHWLLG GAALVVLLAG LKAAAGVVTP LLLAAFLAII 
CAPPLTWMRR RGVPGSVAVL ALFVAVGLAF FLLFLALQGA VESMAHQAPH YQARLFGLFD 
ETMAWLAGRG VPAELLPDRP PLPALADLTG LARAVAGGVG QFTATTFLVL LAFMFLLLEE 
THLPGKLRAA FPRSRRGGVR ARRFLRSVYR YLFIKSATSL ATGLLVGVGL ALIGVDFPVL 
WGILAGLLNF IPTVGSILAA IPAVLIAFLG LGVMEGLLAL ALYVAVNVVI GSVLEPRFMG 
HTLGLSPLVV LVSLMAWGWV LGPVGMLLSI PLTMIAKLAL EAQPGTRWLA IMMSDRARGH