Gene Mlg_1904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_1904
Symbol
ID	4270104
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	2171472
End bp	2173166
Gene Length	1695 bp
Protein Length	564 aa
Translation table	11
GC content	72%
IMG OID	638126660
Product	DNA repair protein RecN
Protein accession	YP_742738
Protein GI	114321055
COG category	[L] Replication, recombination and repair
COG ID	[COG0497] ATPase involved in DNA repair
TIGRFAM ID	[TIGR00634] DNA repair protein RecN

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAGCC ACATCGATAT CCGCGACTTC GCCATCGTCG ACCAGCTCGA ACTGGACTTC 
GGCGCCGGGA TGAACGTGCT CACCGGCGAG ACCGGGGCGG GCAAATCCAT CCTGCTCGAC 
GCTCTGGGGC TCTGCCTGGG CGACCGCGCC GACAGCGGCA CCGTCCGCCC CGGGGCCAAG 
CGGGCGGACC TCAGCGTCAG CTTCCGGCTC GCCCCCGACA GCCCCGTGCA CGACTGGCTG 
GCCGAGCACG ACCTGGATGA GGACGGCGAC TGCATCCTCC GTCGCACCAT CCAGGAGAGC 
GGCCGCACCC GCGGCTACAT CAACGGCCGC CCCGCCCCGC TCAACCTGCT CAAGGCCCTG 
GGCGAGCAAC TGGTCGACAT CCACGGCCAG CACGCCCACC AGCTGCTGCT GCGCCGCCAC 
GTCCAGCGCC GGATCCTGGA CGAGCACGCC GACGAGGGCG GCGCCCTGGA ACGGGTCCGC 
TCGCTCCACC AGCAGCTGCG TGCGGTGGAC GAGGAGCTGC GCGCCTTGGA GGGCGACCGG 
GAGAGCCACG AGGACCGCCT GGCGCTGCTG CGCTACCAAG TGGACGAGCT GGCCGCACTG 
GAGCTGACGG TGGAGGGCAT CGAGGCGCTG GAGCAGGAAC AGAAGCGCCT GGCCAATGCC 
GGCGCCCTGA TTCAGATGGC ACAGCAGATC CTCGACCCGC TCTACGACGA CGAGCAGTCC 
GCGCAGGCCG CCCTGGGCCG CGCCAGCCGC GAACTGGACG GCCACGCCGG GCTGGACCCG 
GCCCTGGACG AGGCCCGGGA GCTGTTCGGC AACGCCCTGG TGCAACTTGA GGAGGGCTGC 
GATGCCCTGC GCCGGTTCGC CGACAACCTG GAGCTGGACC CGGAGCGCCT GGCCTGGGCC 
GAGGAGCGAC TGGGCCAACT GAGCGACCTG GCGCGCAAGC ACCGCTGCCG TCCGGAGGCC 
CTCCCCGAGC GGCTCGAGGC CCTGCAGGCG GAGCTCGCAG AGCTGGAGGG GGCCGGGGAG 
CGGGTCCAGG CCCTGCGCGA GCAGCGCGCG GCCCTGCATC GCGACTACCG GGAGGCCGCC 
GCCACGCTCA GTGAGCAACG CCAGGCCCAC GCCCGGGCCC TGGAGCAGCG GGTGGCCGGG 
CTGCTGGAGG AGCTGAGCAT GGGCGGGGCC GAGCTCCAGA TCCAGGTGGC CTTCGACGCC 
GAGGCCGAGC CCACCCCGCA CGGGCTGGAT CAGGTGGAGT TTCTGGTCCG CACCAACCCT 
GGCCAAGCCT TCGGGCCGCT GGCCAAGGTG GCCTCCGGCG GCGAGCTGTC ACGGTTGGGG 
CTGGCCCTGC AGGTCGCCAG CACCAAGGGC ACCGGCGCCC CCACCCTGAC CCTGGTCTTC 
GACGAGGCGG ACAGCGGGAT CGGCGGTGCC GTGGCCGAGG TGGTCGGGCG CCTGCTGGCC 
TCGCTGGGCC AACGCTACCA GGTGCTGTGC ATCACCCACC TGCCCCAGGT GGCCGCCCAG 
GCCGGGTGCC ACTTTCAGGT CAGCAAGCAC AGCGAACGGG ACCGGACCCG CACCCGGGTC 
ACCCCGCTCA CCGGCGAGCA GCGGATTCAG GAAGTGGCCC GAATGCTGGG CGGCGTGGAG 
ATCAGTGATA ACACCCTGGC CTCGGCCCGG GAGATGCTGG AACGCGGCGC CGGCAGGCGC 
CGGGAGACCG CCTGA

Protein sequence

MLSHIDIRDF AIVDQLELDF GAGMNVLTGE TGAGKSILLD ALGLCLGDRA DSGTVRPGAK 
RADLSVSFRL APDSPVHDWL AEHDLDEDGD CILRRTIQES GRTRGYINGR PAPLNLLKAL 
GEQLVDIHGQ HAHQLLLRRH VQRRILDEHA DEGGALERVR SLHQQLRAVD EELRALEGDR 
ESHEDRLALL RYQVDELAAL ELTVEGIEAL EQEQKRLANA GALIQMAQQI LDPLYDDEQS 
AQAALGRASR ELDGHAGLDP ALDEARELFG NALVQLEEGC DALRRFADNL ELDPERLAWA 
EERLGQLSDL ARKHRCRPEA LPERLEALQA ELAELEGAGE RVQALREQRA ALHRDYREAA 
ATLSEQRQAH ARALEQRVAG LLEELSMGGA ELQIQVAFDA EAEPTPHGLD QVEFLVRTNP 
GQAFGPLAKV ASGGELSRLG LALQVASTKG TGAPTLTLVF DEADSGIGGA VAEVVGRLLA 
SLGQRYQVLC ITHLPQVAAQ AGCHFQVSKH SERDRTRTRV TPLTGEQRIQ EVARMLGGVE 
ISDNTLASAR EMLERGAGRR RETA