Gene Acid345_1283 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_1283
Symbol
ID	4071355
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	1559025
End bp	1560059
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	64%
IMG OID	637983292
Product	transcriptional regulator Ada / DNA-O6-methylguanine--protein-cysteine S-methyltransferase
Protein accession	YP_590359
Protein GI	94968311
COG category	[F] Nucleotide transport and metabolism [L] Replication, recombination and repair
COG ID	[COG0350] Methylated DNA-protein cysteine methyltransferase [COG2169] Adenosine deaminase
TIGRFAM ID	[TIGR00589] O-6-methylguanine DNA methyltransferase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACAG AAACCATGTG GGAGAAGGTC CTCCAGCGCG ACGCCGCCGC CGATGGCCGC 
TTCGTTTACG CCGTCCGCAG CACGCATATT TACTGCCGCC CGACGTGCCC GAGCAAGCGC 
CCTAACCGCG AACAGGTTGA ATTCTTCGCC AATCCGAAAG AAGCCGAGCA GAAGGGCTAC 
CGCGCCTGCC GCCGCTGCGC CCCGAAGACT GAGAACATCG CCTCCCACGT TGCCCGCATC 
TGCCGCGAAC TCACCGACGA CTACAAGGGC CTCTCGCCCG AAGACATCGC CGCGCGCGAG 
GGCCTGGCAC TGCGCCGCCT GAACCAGATC TTCCGCACCG TCCTCGGCGT GACAGTGCGC 
GAGTATCTCG CCAGCCACAA ACTGGAAGAC TTCAAGTCGA AGCTGAAGAC CTCGCAGGAC 
GTCACCGGAT CCATGTACGA CGCCGGCTTC GGTTCCCCCA GCCGTCTCTA CGAAAAGTCC 
GACGCTGTCC TCGGCATGAC GCCCGCCAGC TACGGCCGCG GCGGCCGCGG CGCGCACATC 
GCCTTCGGAA TTCGCGACTC CGAGATCGGC CACATCCTGA TCGCCGCGAC AGAGAAAGGC 
GTCTGCACGA TCAGCTTCGG CGACAACGCC AAGAAGCTCG AGTCCGACCT CCGCAAGGAA 
TTCCACGCCG CCGAGATCAC CCGCAACGAC GACGCTGTCG AGCAATATCT CGACGCGATA 
GCCGCGCACA TCGAAGGCAA CGAATTCCTC ACATCGATCC CCATCGATAT CCACGCCACA 
GCGTTCCAGG CCAAAGTCTG GCAACTCCTG CGCAACACCA AGCCCGGCGA AACCCTCACC 
TACAGCGGCC TCGCCGCGAA GCTCGGCGCG CCATCGGCCT CGCGTGCGGT CGCGCGCGCC 
TGCGCCTCGA ACCGCGTCGC CATCGCGATC CCCTGCCATC GCGTGGTCGC CGCCTCGGGC 
GATCTCAGCG GCTATCGCTG GGGCGTCGAA CGCAAGCGTC AACTTTTGCA GCGCGAGCGA 
AAACAAGTAG TCTAA

Protein sequence

MSTETMWEKV LQRDAAADGR FVYAVRSTHI YCRPTCPSKR PNREQVEFFA NPKEAEQKGY 
RACRRCAPKT ENIASHVARI CRELTDDYKG LSPEDIAARE GLALRRLNQI FRTVLGVTVR 
EYLASHKLED FKSKLKTSQD VTGSMYDAGF GSPSRLYEKS DAVLGMTPAS YGRGGRGAHI 
AFGIRDSEIG HILIAATEKG VCTISFGDNA KKLESDLRKE FHAAEITRND DAVEQYLDAI 
AAHIEGNEFL TSIPIDIHAT AFQAKVWQLL RNTKPGETLT YSGLAAKLGA PSASRAVARA 
CASNRVAIAI PCHRVVAASG DLSGYRWGVE RKRQLLQRER KQVV