Gene Mlg_2695 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mlg_2695
Symbol
ID	4269938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Alkalilimnicola ehrlichii MLHE-1
Kingdom	Bacteria
Replicon accession	NC_008340
Strand	+
Start bp	3056996
End bp	3058081
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	73%
IMG OID	638127455
Product	A/G-specific DNA-adenine glycosylase
Protein accession	YP_743525
Protein GI	114321842
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.375064
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGACC GCCCCGGCGC ACCGGGCACT GAGGAGGAGG CGGTCAATCG GACCCGGGCG 
GCGATCCTGG CCTGGTTCGA CCGCCACGGC CGCCACGACC TGCCCTGGCA GCATCCGGCC 
ACCCCCTACC GGGTGTGGGT CTCGGAGGTG ATGCTGCAAC AGACCCAGGT GGCCACCGTG 
GTGCCCTACT TCCACCGTTT CATGCGCCGA TTCCCCAGCC CGCGTGCGCT GGCGGACGCA 
CCACAGGAGG AGGTGCTGGC GCTCTGGGCC GGGCTGGGTT ACTACGCCCG CGCCCGCAAC 
CTGCACCGGG CCGCGCAACA CATCCGCGAT CAATACGGCG GGGAACTGCC CGCAGACCTG 
GACGCCCTGG AGGCCCTCCC CGGCATCGGC CGCTCCACCG CCGGCGCCAT CCACTCCCTC 
GGCCAGGGGC GCCGGGCGGT CATCCTGGAT GGCAACGTCA AGCGGGTGCT GGCCCGCTGG 
CATGCGGTGG ACGGCTGGCC CGGCCGGACC GCCGTCGCCC GCCGGCTGTG GGCGCTCGCC 
GAGCACTACA CCCCGGCCCA CCGCTGCGCC GACTACAACC AGGCCATGAT GGACCTGGGC 
GCTACCGTCT GCACCCGGCG CACCCCCCGC TGCCATGAGT GCCCACTGCA GGCCCGATGC 
GCCGGCCACG CCAGCGGCCG GCCGGAGGCC TGGCCCACCC CGAAACCCAA GCGCCGGCGC 
CCGCTGCGCC AGACCCGCAT GCTCATTCTC CAGCACGGCG ACCGGGTGCT GCTGCAGCGC 
CGCCCCCCGA GCGGCGTCTG GGGCGGCCTC TGGAGCTTGC CCGAGGCGGC CGTGGACGCC 
GACCCGAAGA GCGCGGCGGC CGCGCTCGGC CTCAAGGTCG ACCAGGCCGG CCACTGGCCG 
CCCCTGCGCC ACGCCTTCAG CCACTTTGAA CTGGACATCC ACCCGATTCA CCTGCGGGTT 
TCCGGGGCGG GCCAAGCGGT GAAGGAGAGT GATACACTTT GGCAATCCAT TCATGACACC 
GGCGCCCGGG CGGTGGCCGC CCCGGTGGCC CGGTTACTGG AACGACTCAG GGAGTACACA 
CCATGA

Protein sequence

MADRPGAPGT EEEAVNRTRA AILAWFDRHG RHDLPWQHPA TPYRVWVSEV MLQQTQVATV 
VPYFHRFMRR FPSPRALADA PQEEVLALWA GLGYYARARN LHRAAQHIRD QYGGELPADL 
DALEALPGIG RSTAGAIHSL GQGRRAVILD GNVKRVLARW HAVDGWPGRT AVARRLWALA 
EHYTPAHRCA DYNQAMMDLG ATVCTRRTPR CHECPLQARC AGHASGRPEA WPTPKPKRRR 
PLRQTRMLIL QHGDRVLLQR RPPSGVWGGL WSLPEAAVDA DPKSAAAALG LKVDQAGHWP 
PLRHAFSHFE LDIHPIHLRV SGAGQAVKES DTLWQSIHDT GARAVAAPVA RLLERLREYT 
P