Gene Amir_0343 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_0343
Symbol
ID	8324501
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	-
Start bp	372629
End bp	373618
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	76%
IMG OID	644940888
Product	HhH-GPD family protein
Protein accession	YP_003098158
Protein GI	256374498
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGCA CGACGAGTCC CACCACGAGC CGCGCGACGA ACCGGACCGC GAGCGCCACC 
ACCGCCACCG CCGCAGCGGG CGCTGCCGAG GACGCCGCCA AGCCGGAGAG CGCCCACCTT 
CCCCCGTCGG TGCTGAACAC CTGGTTCGCC GCCACCGCGC GCGACCTGCC CTGGCGCGAC 
CCCGAGTGCA CCGCCTGGGG CGTCCTGGTC AGCGAGATCA TGCTCCAGCA GACCCCCGTC 
GCCCGCGTCG AGCCGATCTG GCGGGTCTGG CTGGACAAGT GGCCGAGGCC CAGCGACATG 
GCCGCCGCCT CCCAGGGCGA GGTGCTGCGC ATGTGGGGCA AGCTCGGCTA CCCGCGCCGC 
GCCCTGCGCC TGCACGCCGC CGCCCAGGCC GTCGCCGCCG AGCACGACGA CGTCGTCCCG 
GACGACGTGG AGACCCTGCT GGCCCTGCCC GGCATCGGCG CGTACACCGC GCGGGCCGTC 
GCCGCCTTCG CCTACGGCCG CCGCTGCCCG GTGGTGGACA CCAACGTCCG CCGCGTCGTG 
GCGCGGGCCG TGCACGGGGC CGGGGACGCG GGCCCGCCGT CGACCACCAG GGACCTGCGG 
GACGTGGAGG CGCTGCTGCC CGAGGACGAG GCGTCGGCCG CGACCTACTC GGCGGCGCTG 
ATGGAGCTGG GCGCGCTGGT GTGCACGGCC AGGACCCCGC GCTGCTCGGC GTGCCCGGTG 
CTGGGCTCGT GCCAGTGGCA GCGCAACGGG CGGCCCGCGT ACGACGGGCC CGCGAAGGCG 
GTGCAGAAGT TCGCGGGCAC CGACCGGCAG GTGCGCGGGC GGCTGCTGGA CGTGCTGCGC 
GGCACGTCCG AGCCGGTCGC CAAGGAGGTG CTGGACCGGG CCTGGTCGGA CGCCGGTCAG 
CGGGACCGGT GCCTGCACTC GCTGCTGGTG GACGGGCTGG TCGAGCAGAC CGCCGCCGGG 
CTGTTCGCGC TGCCCGGCGA GCACGAGTGA

Protein sequence

MSRTTSPTTS RATNRTASAT TATAAAGAAE DAAKPESAHL PPSVLNTWFA ATARDLPWRD 
PECTAWGVLV SEIMLQQTPV ARVEPIWRVW LDKWPRPSDM AAASQGEVLR MWGKLGYPRR 
ALRLHAAAQA VAAEHDDVVP DDVETLLALP GIGAYTARAV AAFAYGRRCP VVDTNVRRVV 
ARAVHGAGDA GPPSTTRDLR DVEALLPEDE ASAATYSAAL MELGALVCTA RTPRCSACPV 
LGSCQWQRNG RPAYDGPAKA VQKFAGTDRQ VRGRLLDVLR GTSEPVAKEV LDRAWSDAGQ 
RDRCLHSLLV DGLVEQTAAG LFALPGEHE