Gene Mlg_1894 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1894
Symbol
ID	4270094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2159300
End bp	2160802
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	69%
IMG OID	638126650
Product	FAD linked oxidase domain-containing protein
Protein accession	YP_742728
Protein GI	114321045
COG category	[C] Energy production and conversion
COG ID	[COG0277] FAD/FMN-containing dehydrogenases
TIGRFAM ID	[TIGR00387] glycolate oxidase, subunit GlcD

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.140191
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGCGC ACTCCGTATA CCGCGAGGAG GACTGCCGCT TCGAGTACGA TCGCGAGGAC 
CTGATCGCCC GCCTGGGCGG GGTTCTGGAC GACCCCGAAG CGCTGATCAC CAACGAAGAG 
GCCCTACGGG CCTACGAGAC CGACGGTCTG GCCGCTTACC GCCAGCTGCC GGTAGCAGCG 
GTCCTGCCGG ACACGGTGGA GCAGGTGCAG GCCATCCTGC GCATCTGCCA TGAGCTGGAG 
GTGCCGGTGG TGGCCCGTGG TGCGGGCACC AGCCTCTCCG CCGGCGCCCT GCCCCACCCC 
CAGGGTATTC TCCTCAGCCT GTCCCGCTTC AACCGCATTC TGGAGGTGGA CGCCGAACGG 
CGCATTGCGC GGGTCCAGCC CGGGGTGCGC AACCTGGCGG TGTCCGAGGC CGCGGCCCCC 
TACGGGCTTT ACTACGCCCC GGACCCCTCC TCGCAAATTG CCTGCAGCAT CGGCGGCAAC 
GTGGCGGAGA ACGCCGGCGG GGTGCACTGC CTGAAGTATG GCCTGACCAT CCACAACGTC 
CTCGAGGCCA CCCTGATCAC CATCGACGGC GATGTCATCA AGGTGGGCAG CGAGGCGCCG 
GACGCCCCCG GATACGACCT GCTGGCGGCG GTGATCGGCT CCGAGGGCAT GCTCGGCGTG 
GTGGTGGAGG TGGCGGTCAA GCTGCTGCCC GAGCCGTTGA CCAAGAAGGT GATGCTGGCC 
GCCTTCCCCA CCGTCGAGGC CGGCGGCGAG GCGGTGGCCG GGATCATCGG CGACGGCATC 
ATCCCCGGTG GCCTGGAGAT GATGGACAAC GCCGCCATCC GCGCCGCCGA GGACTTCGTC 
CACGCCGGCT ACCCGGTGGA TGCCGCCACC ATCCTGATCT GCGAGCTGGA CGGCAGTGAG 
GCGGAGGTGG CCGCCCAGTG CGACCGGGTG CGCAAGCTGA TGGAGCGCTA CGGGGCCACC 
GAAATCCGCA TCGCCGAGAC CCCCGAACAG GCGCAGCGCT TCTGGGCCGG GCGCAAGGCG 
GCCTTTCCCG CGGTGGGCCG TATCTCCCCC GACTACTACT GCATGGACGG CACCATCCCA 
CGCAAGCACC TGGGCACGGT GCTCAAGCGC ATGCAGGCCC TCTCCGAGCA GTACGGCCTG 
CGGGTGGTGA ACGTCTTTCA CGCCGGTGAC GGCAACCTGC ACCCGCTGGT GCTCTACGAC 
GGCAACGTCC CGGGCGAGCT GGAACGCACC GAGGAGCTGG GCGGGCGCAT CCTGGAGTTG 
TGTGTGGAGG TCGGCGGCAC GGTCACCGGC GAGCACGGCG TGGGCATGGA GAAGCTCGAC 
CAGATGTGCG TGCAGTTCAA CAAGGCGGAG CGCGAGCAGT TCTTCGCCCT CAAGCGCGCC 
TTCGATCCCA AGGGGCTGCT CAACCCCGGC AAGGCCATCC CCACCCTGCA CCGCTGCGCC 
GAGTTCGGCG CCATGCACGT GCACCACGGC GAACTGCCCT TCCCGGACAT CGAGCGCTTC 
TGA

Protein sequence

MSAHSVYREE DCRFEYDRED LIARLGGVLD DPEALITNEE ALRAYETDGL AAYRQLPVAA 
VLPDTVEQVQ AILRICHELE VPVVARGAGT SLSAGALPHP QGILLSLSRF NRILEVDAER 
RIARVQPGVR NLAVSEAAAP YGLYYAPDPS SQIACSIGGN VAENAGGVHC LKYGLTIHNV 
LEATLITIDG DVIKVGSEAP DAPGYDLLAA VIGSEGMLGV VVEVAVKLLP EPLTKKVMLA 
AFPTVEAGGE AVAGIIGDGI IPGGLEMMDN AAIRAAEDFV HAGYPVDAAT ILICELDGSE 
AEVAAQCDRV RKLMERYGAT EIRIAETPEQ AQRFWAGRKA AFPAVGRISP DYYCMDGTIP 
RKHLGTVLKR MQALSEQYGL RVVNVFHAGD GNLHPLVLYD GNVPGELERT EELGGRILEL 
CVEVGGTVTG EHGVGMEKLD QMCVQFNKAE REQFFALKRA FDPKGLLNPG KAIPTLHRCA 
EFGAMHVHHG ELPFPDIERF