Gene Amir_4012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Amir_4012
Symbol
ID	8328205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Actinosynnema mirum DSM 43827
Kingdom	Bacteria
Replicon accession	NC_013093
Strand	+
Start bp	4693917
End bp	4695188
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	77%
IMG OID	644944484
Product	heat domain containing protein
Protein accession	YP_003101721
Protein GI	256378061
COG category	[L] Replication, recombination and repair
COG ID	[COG4335] DNA alkylation repair enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTTCCG TGCCCACAGC CGATGAGCTC CTGAGCCCCA CGACCGTCCT CGACCTGGCC 
GAGCGCCTGC GCCTGGCCGG GACGCCCTGC CCGCGCGTGG CCGGGGTCGC GGGCGCGCTG 
GACGGCGTCG CGCTGGCGGG GCGGACCAGG CTGGTCGCGG ACGCGGTGCT GGCCGACCTG 
CCGGAGGACT GGTCGGCGTT CGAGGCGGTG CTGCTGGCGG CGCTGACCGA TCCGGGCTTC 
GGCGGCTGGG CGGTGTGGCC GCTGTCCGAG GCGCTGGCGG CGCGCGCCGC GTCGACCGGC 
CGCGTCCGGG AGGGCTTGGC CGTGCTGGCG GCCCTGACCG GGCGGCTGAC CGGCGAGTTC 
GCGCTGCGCA CGTTCCTGCT GGCCGACCTG GGCACGACCC TGGAGGTGGC GCTGGCGTGG 
ACGGCGTCGC CGGACGAGCA CGTGCGGCGG CTGGCCAGCG AGGGCACCCG GCCGTTCCTG 
CCGTGGGGCA GACGGGTGCC GGGGCTGACG GCGGAGCCGG GGCGGGCGCT GCCGGTCCTG 
GAGGCGCTGC GCGCGGACGA GTCGGAGTAC GTGCGCCGCT CGGTGGCCAA CCACCTGAAC 
GACGTGAGCA GGCTGGACCC GGCGCTGGTG GTCGACGTGG CCGGGCGCTG GCTGGCCGCC 
CCGGCCCCGA CGACGCCCCG GCTGGTGCGG CACGCGCTGC GCACCCTGGT CAAGCGCGGT 
GATCCGGGGG CGCTGGGGCT GCTGGGGTAC GGGGCGGCGG AGGTCGAGGT GGGCGGCCCG 
GTGCTGACCA GGGCGGAGGT GCGGTTCGGG GGCGAGTTGG AGTTCACGGC GGAGGTGGTG 
AACCGGGGCC GGGAGGCGGC GCGGCTGGCG ATCGACTACG CGGTGCACTA CGTGAAGGCG 
GACGGTTCGA GGACGCCGAA GGTGTTCAAG CTGACCACGC GCGTGCTGGA GCCGGGCGAA 
CGCGCGCTGC TGACCAAGCG CCACCCGTTC CGCGAGATCA CCACCCGACG GCACCACGCG 
GGCACGCACG CGGTGGAGCT CCAGGTCAAC GGCGTCAGGC ACGGGCTGAC CGAGTTCACC 
CTGACGGGGC TGCCCGGACC ACGCGCGGTG GTGAGGGGTG CGGCGCCGGG CGCAACGGCG 
GAGGCAGCGG CGCCGAGCGC CACACCGGAC ACGACCGGAC CAGGAACGGG ACCGGGTGCG 
GGTGCGGGTG CGGGAACGGG CGCGGGCGCG GGTGTGGGTG CGGGGCTGGC TGCGGAGGTG 
ACGCGCACCT GA

Protein sequence

MGSVPTADEL LSPTTVLDLA ERLRLAGTPC PRVAGVAGAL DGVALAGRTR LVADAVLADL 
PEDWSAFEAV LLAALTDPGF GGWAVWPLSE ALAARAASTG RVREGLAVLA ALTGRLTGEF 
ALRTFLLADL GTTLEVALAW TASPDEHVRR LASEGTRPFL PWGRRVPGLT AEPGRALPVL 
EALRADESEY VRRSVANHLN DVSRLDPALV VDVAGRWLAA PAPTTPRLVR HALRTLVKRG 
DPGALGLLGY GAAEVEVGGP VLTRAEVRFG GELEFTAEVV NRGREAARLA IDYAVHYVKA 
DGSRTPKVFK LTTRVLEPGE RALLTKRHPF REITTRRHHA GTHAVELQVN GVRHGLTEFT 
LTGLPGPRAV VRGAAPGATA EAAAPSATPD TTGPGTGPGA GAGAGTGAGA GVGAGLAAEV 
TRT