Gene Mlg_2742 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2742
Symbol
ID	4270211
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	-
Start bp	3109979
End bp	3111352
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	69%
IMG OID	638127504
Product	hypothetical protein
Protein accession	YP_743572
Protein GI	114321889
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGGCC ATCAGACGGT CAGGGCGGCG GCGCCCATCG CCGCGGTTGC GCTGTCGGTC 
CTGCTCGGCG TGGGGTCGCC GGTGGCGCTC GCCCAGGGCG ACGACCTGTG GGAGGACGAC 
GCCTGGGGGG AGGAGTCCTG GGACGATGAC CCCTGGGAGG ACGACCCTTG GGAGGAGGAG 
AGCGGGCTGC CCTTCGACCT CGAAGGCTTT TTCGAGGCCG CCGGGGGGCA TCACATCCGC 
AACAACCGGG TCACCGACAA GGACTACAAC CTGGCCGAGG CCCGCCTGCA GTTGGACATG 
CGCGGCGACT GGCGCCGTTA CCGCTTCCGG GTGCGTGCCG ACGGGGTGGC CGACGGCGTC 
GACGAAGAGT TGCGCGGTGA GCTGCGCGAG GCCCGGGTCA GCTTCCCCGT CGGCGACCGG 
CTGGATGTCC GGGCCGGGCG GCAGATCCTC TCCTGGGGCA CGGGGGACCT GCTCTTCGTC 
AACGATCTGT TCCCCAAGGA CTTCGAATCC TTCCTGACCG GCCGCGACGA GGACTACCTG 
CAGGCCCCCT CCGATGCCCT GCGCGGGACC TGGTACGGCG ACGCCGTCAC CCTGGACGTG 
GTCTGGACCC CGGTGTTCGA GCCGGACCGC TTCGTCGACG GCGATCGCCT GTCCTACTTC 
GATCCCGCCA CCGGGGCGCG CACCGCCGAG TCGCTGCCCG CCACTGCCCC GGACGACTTC 
CCGGACGATG GCGAGCTGGC CGCCCGCCTC TCCCGGCGGG TCGGTGGGGT GGAGCTGGCC 
GGTTATCTCT ACCGCGGCTT TTTCCCTCAG CCCAGCGAGC AGATCGGCAC CGCGGACCAG 
CCGCGTCTCA CCCACGCCCG GCTGAACGCC TACGGCGCCA GTGTGCGGGC CCCGGTGGCC 
GGCGGTATCG GTAATGCCGA GATCGGTTAC TACGACTCGG TGGATAACCG CGACGGCAAG 
GCAGCACCGT GGGTGCCCAA CTCCCAGGTG CGGTTTCTCC TGGGGTACAC CCGGGAGCTG 
ATCGCCAACC TCGATCTGGG CCTGCAGTAC TACGCCGAAC GGCTGCAGGA CCACGATGAA 
CTGAAGGCGC GCTGGATGGC CGACGAGGAC TACCTGCCGG AGGCCTACCG GGATGTCGTC 
ACCGTCCGGC TGACCTATTC CATGTGGCGC GACGATCTGA TCTGGTCGCT GTTCAGCTAC 
CTCTCGCCCG CCGACGAGGA TTACTACCTG CGTCCGAGCG TCCGCTACCG CGCCTCGGAT 
GCCGTTACCT ACACCTTCGG CGGCAACCTC TTTGGCGGCA AGGACCGCCA TACGTTCTAC 
GGGCAGTTCA AGCGGGATTC CAATCTCTAT GCCCGCGTGC GCTTCCGGTT CTGA

Protein sequence

MPGHQTVRAA APIAAVALSV LLGVGSPVAL AQGDDLWEDD AWGEESWDDD PWEDDPWEEE 
SGLPFDLEGF FEAAGGHHIR NNRVTDKDYN LAEARLQLDM RGDWRRYRFR VRADGVADGV 
DEELRGELRE ARVSFPVGDR LDVRAGRQIL SWGTGDLLFV NDLFPKDFES FLTGRDEDYL 
QAPSDALRGT WYGDAVTLDV VWTPVFEPDR FVDGDRLSYF DPATGARTAE SLPATAPDDF 
PDDGELAARL SRRVGGVELA GYLYRGFFPQ PSEQIGTADQ PRLTHARLNA YGASVRAPVA 
GGIGNAEIGY YDSVDNRDGK AAPWVPNSQV RFLLGYTREL IANLDLGLQY YAERLQDHDE 
LKARWMADED YLPEAYRDVV TVRLTYSMWR DDLIWSLFSY LSPADEDYYL RPSVRYRASD 
AVTYTFGGNL FGGKDRHTFY GQFKRDSNLY ARVRFRF