Gene Mlg_1664 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1664
Symbol
ID	4268896
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	1903576
End bp	1904853
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	68%
IMG OID	638126422
Product	polysulphide reductase, NrfD
Protein accession	YP_742500
Protein GI	114320817
COG category	[C] Energy production and conversion
COG ID	[COG5557] Polysulphide reductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAAC GCATCCAATA CCGCGAATTG ACCGACAACG GGACGGGCTA TCTGGCCGTG 
CAGGCCGGCC TGGCACTGCT GGTCCTGCTG GGCGCCGGCG TGGCGCTGTG GATGATGAAT 
GTCGGGCACT ACGTGACCGG CATGGACAAC CAGGTGGTCT GGGGCACGCC CCACGTCTTC 
GCCGTGCTGC TGATCCTGGC CGCCTCGGGG GCGCTCAACG TCGCCTCACT GGCCTCGGTG 
TTCGGCCGCA GCGAGTACAA ACCGCTCTCG CGCCTTTCCG GCGTGCTGGC CATGGCCCTG 
CTGGCCGGGG GGCTGGCGGT GCTGGTCCTG GACCTCGGCC GACCGGACCG GCTGATCGTG 
GCCATGACCC ACTACAACCT GCAGTCCATC TTCGCCTGGA ACATCTTCCT GTACACCGGC 
TTCTTTGTCG TGGTGGCGGT GTACCTGTGG TTCCAGATGG AGCGGCGGAT GAACCGCCAT 
GCCAACGCCG CGGGCACTGT GGCCTTCGCC TGGCGCATCG TGCTCACCAC CGGCACCGGC 
TCGATCTTCG GCTTCCTGGT GGCCCGCAGC GCCTTCGACA CCGCCCTACT CGCCCCGCTG 
TTCATCGCCG CATCCCTGAG TTACGGCACC GCCGCCTTCA TCCTGGTGGC CAGCGGCCTC 
CTTCGGGTAC AGAACCGCCG GCTGCCGCAA GAGCTGCTCA GGGGATTGGG CCGCCTGCAG 
GTGCTGTTTA TTCTCGCTAC CGTCTACCTG CTGGCCATCT ACCTGGTCAC CCACGCCTAC 
ATGCCGGACC GCCACGGCGT CCTGCGTTTC CTGTTGTTGG AGGGCGGGGT CTACCCGGCC 
CTCTTCTGGG GCGTCCAGAT CCTGCTGGGG GCGGTGCTAC CACTCTTCCT GCTGCTGACC 
GGCCCGGGCG CCGGCGCCCC GATGCGGTTG GTGGCCGCCG CTGGCCTGGT GTTGCTGGGC 
GGGCTGGCAC ACCTGTACGT CACCATCATC GGCGCCCAGG CCTATCCCTT GGCGCTGTTC 
CCCGGCATGA CGGTGTCCAG CACCTTCTTC GACGGCCAGG TCACCCACTA CGCCCCCACC 
CTGCCGGAGG TCGTGCTCGG CATAGGGGGC ATCGCCCTGG CGACGCTGCT GGTCTGTCTC 
GCCACCCGGG TCCTGCCCAT CGTCCCCGAC GCACTGCCCG GCGAGGCCGA AGAGCGCCGC 
GAGGCCGAGG CCGCCACCCG CGAGCCGGAC AGTGAAGCTG CGCCACAGAC GGCCATCACC 
CAACAGGACA CCGCCTGA

Protein sequence

MSQRIQYREL TDNGTGYLAV QAGLALLVLL GAGVALWMMN VGHYVTGMDN QVVWGTPHVF 
AVLLILAASG ALNVASLASV FGRSEYKPLS RLSGVLAMAL LAGGLAVLVL DLGRPDRLIV 
AMTHYNLQSI FAWNIFLYTG FFVVVAVYLW FQMERRMNRH ANAAGTVAFA WRIVLTTGTG 
SIFGFLVARS AFDTALLAPL FIAASLSYGT AAFILVASGL LRVQNRRLPQ ELLRGLGRLQ 
VLFILATVYL LAIYLVTHAY MPDRHGVLRF LLLEGGVYPA LFWGVQILLG AVLPLFLLLT 
GPGAGAPMRL VAAAGLVLLG GLAHLYVTII GAQAYPLALF PGMTVSSTFF DGQVTHYAPT 
LPEVVLGIGG IALATLLVCL ATRVLPIVPD ALPGEAEERR EAEAATREPD SEAAPQTAIT 
QQDTA