Gene Acry_1502 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_1502
Symbol
ID	5159866
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	-
Start bp	1663732
End bp	1664775
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	68%
IMG OID	640553415
Product	HhH-GPD family protein
Protein accession	YP_001234629
Protein GI	148260502
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGTCGGT CCCTGCCATC CGCCGAAAAT CTGCTCCGCT GGTATCATGT TCACCGGCGC 
ATCCTGCCTT GGCGCGCCGG CCCGGGTACC CTGCCCGATC CCTATCATGT CTGGCTGAGC 
GAAATCATGC TGCAGCAGAC AGTCGTAGCG ACTGTCATAC CTTATTTCCA TCGCTTCATC 
GAGCGTTTCC CCACGATCAG CGACCTCGCG GTCGCGGTGG ATGATGAGAT TCTGGGCCTG 
TGGGCGGGGC TTGGCTATTA CGCGCGGGCA CGCAACCTGA TCCGCTGCGC GAGGGCCGTC 
GCCGAGGCGG GCGGGTTTCC CGTCACGCTC GACGGGCTAC GTGCGCTGCC CGGCATCGGC 
CCTTATACGG CTGCGGCGAT CGGCGCGATC GCCTTCGATA TTCCGGTGGT TCCGGTGGAC 
GGCAATGTCG AGCGGGTTAC CGCCAGGATG TTCGCGATCG AGGAGGCGTT GCCCGCGGCG 
AAGGACGCGA TTGCGGTCGC CGCTGCCCGC CTTGGCGCGC AGGCGGCAGC GCAATCCAGC 
CCAGGTGACT TTGCGCAGGC ATTGTTCGAT CTCGGAGCCA CCGTCTGCAC GCCGCGCAGT 
CCATCATGCA TGGTCTGCCC GTGGCGCGAC GGATGCGCGG CACATGCCCG GGGGCTGTCC 
GCCGACCTGC CGCGCAAGGC GAAGCGCGCG GCGCGGCCCG TGCGGCGCGG CACCGTGTTC 
GTGATGCAGG ATCGATCCGG CATGATTGGC CTGCGCCGGC GGCCACCACG CGGATTGCTC 
GGAGGGATGC TGGAGGTGCC GGGCACGGAT TGGGAGGCGA CAGCTCCGCC CCCGGTGCCG 
CCATGCGCCG CGCATTGGCT TGATGCCGGC ACGATCATTC ACGTTTTCAC CCATTTCGAG 
TTGCGCCTCA CCGTGAAGGC GGGCCGCGTC GCGGCGCTAC CCGGCGGGAT CGTCGCCGCG 
CCGCCCGATA CGCCTCTGCC GACCGTGATG CGCAAGGCGC TGGAGGCCGG GCTTGCTGTT 
CTCGATGAGC GGTCGCCGAA ATAA

Protein sequence

MSRSLPSAEN LLRWYHVHRR ILPWRAGPGT LPDPYHVWLS EIMLQQTVVA TVIPYFHRFI 
ERFPTISDLA VAVDDEILGL WAGLGYYARA RNLIRCARAV AEAGGFPVTL DGLRALPGIG 
PYTAAAIGAI AFDIPVVPVD GNVERVTARM FAIEEALPAA KDAIAVAAAR LGAQAAAQSS 
PGDFAQALFD LGATVCTPRS PSCMVCPWRD GCAAHARGLS ADLPRKAKRA ARPVRRGTVF 
VMQDRSGMIG LRRRPPRGLL GGMLEVPGTD WEATAPPPVP PCAAHWLDAG TIIHVFTHFE 
LRLTVKAGRV AALPGGIVAA PPDTPLPTVM RKALEAGLAV LDERSPK