Gene Arth_0177 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0177
Symbol
ID	4447370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	180855
End bp	181898
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	71%
IMG OID	639687972
Product	HhH-GPD family protein
Protein accession	YP_829678
Protein GI	116668745
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGGGCACC ACCACGCCGG GAGGCGGACC GCGGGCCATA TCCACTACAG TATTTGCATC 
GAAGCCTTAG CCGTACCCAC TGCCCTGCCC CCGGCGAGTC GCCCCGCATT ACCGCCGCTT 
GCCGCCCTCC ATGACGCCCT TGACGACTGG TTCGGAACCA CAGCCAGGGA TCTGCCGTGG 
CGCGACCCCG AGTGCTCCCC GTGGGGTGTC CTGGTCAGCG AGATTATGCT CCAGCAGACG 
CCCGTTGTCA GGGTCCTGCC CGTCTGGGAA GACTGGCTCC GCCGCTGGCC GTCGCCGGCG 
CACCTGGCGA CCGAGGCCTC CGGCGAGGCA GTCCGGCACT GGGGCAGGCT TGGCTATCCC 
CGGCGGGCCC TGCGCCTGCA TGCAGCCGCC GTCGCCATCG TGGAGAAGCA CGACGGCGGC 
GTGCCGGGAA CGTACGACGA ACTGCTGGAA CTCCCCGGGG TGGGCAGCTA CACGGCGGCC 
GCCGTCGCCG CCTTCGCCTT TGGCCGCCGC GAAACCGTGG TGGACACCAA CATCCGCCGC 
GTCCACGCGC GGCTCTTTTC CGGCACCGCA CTGCCCTCGC AGTCACTGAC AGCGGCCGAA 
ATGCGACTGG CCGCCGAACT GCTGCCGGCC GACGTCGGAC TCTCCGTCCG CTGGAACGCG 
GCGGTCATGG AGCTGGGGGC ACTGGTCTGC ACGGCGAGGG CGCCGAAGTG CGGTGAATGC 
CCTGTGCGGG GGGCGTGCGC GTGGCTGGCG GCCGGCGAGC CACCGCCGTC GTACACCCCG 
AAGGGCCAGT CCTGGCACGG CACCGACCGG CAGGTACGGG GAGCCGTGAT GGCCGTCCTC 
CGGCTGGCTG ACGCACCGGT GGCTCCGGAC ATGTTCCATC AGCCCGCCGC GGACCTTGGC 
TTCGAAGCCG AAGGCATCGG TGTTCCGCTG GCAGCGCTGC ACCGGCTGAA CTCCGCACCC 
GAGCAGCTGG AGCGCGCCCT GGCCGGACTG GTCAGCGACG GCCTGGCGGA ACTGCACCCG 
GCCGGCCTGA CGCTGCCCGC CTGA

Protein sequence

MGHHHAGRRT AGHIHYSICI EALAVPTALP PASRPALPPL AALHDALDDW FGTTARDLPW 
RDPECSPWGV LVSEIMLQQT PVVRVLPVWE DWLRRWPSPA HLATEASGEA VRHWGRLGYP 
RRALRLHAAA VAIVEKHDGG VPGTYDELLE LPGVGSYTAA AVAAFAFGRR ETVVDTNIRR 
VHARLFSGTA LPSQSLTAAE MRLAAELLPA DVGLSVRWNA AVMELGALVC TARAPKCGEC 
PVRGACAWLA AGEPPPSYTP KGQSWHGTDR QVRGAVMAVL RLADAPVAPD MFHQPAADLG 
FEAEGIGVPL AALHRLNSAP EQLERALAGL VSDGLAELHP AGLTLPA