Gene Achl_2238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Achl_2238
Symbol
ID	7293706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter chlorophenolicus A6
Kingdom	Bacteria
Replicon accession	NC_011886
Strand	-
Start bp	2513076
End bp	2514047
Gene Length	972 bp
Protein Length	323 aa
Translation table	11
GC content	67%
IMG OID	643590640
Product	formamidopyrimidine-DNA glycosylase
Protein accession	YP_002488292
Protein GI	220912983
COG category	[L] Replication, recombination and repair
COG ID	[COG0266] Formamidopyrimidine-DNA glycosylase
TIGRFAM ID	[TIGR00577] formamidopyrimidine-DNA glycosylase (fpg)

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0000000000837179
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGCCTGAAC TGCCCGAGGT GGAGGTGGTC CGCCGCGGCC TGGTGAGCTG GGTCCGCGGC 
AGGACCATCG AGTCTGTCGA TGTGCTGGAC CCCCGCTCCA TCCGCCGCCA CGCCCTCGGT 
GTGGAGGACT TCATCGGCAA CCTGCAGGGT GCCACCGTGT CTGATGTCGT CCGGCGCGGC 
AAATTCCTGT GGCTGCCGTT AGTCGATGGT TCCGCCCACC AGCAGGCGGC AGGCAACGGA 
CAAGCCCCAC CCTCGCGGGT GGCGCTGATG GCCCACCTTG GCATGAGCGG GCAACTGCTC 
ATGCAGGACG CGGGCGTTCC GGACGAAAAG CACCTGAAAG TCCGGCTCCA TCTCAGCCCC 
AGTGCCGGCA TGCCTGGCCA GCTGCGCTTC GTGGACCAGC GCATTTTCGG TGGGCTCTTT 
GTCACCGCGT TGGTTCCCAC CGACGACGGC GGCCCCGGCG GCCTCGCGGA GTCGCCCCTT 
CCGCTGATCG CCGGGGAGGC GTCACACATT GCCCGGGATC CGCTGGACCC GGCCTTCTCA 
TTCGACCGTT TCTACCAGCG CCTGCGTGCG CGGAAAACCG GGTTGAAACG GGCGCTCCTG 
GACCAGGGGC TGGTTTCGGG AATCGGTAAC ATCTACGCCG ATGAGGCCCT CTGGCGTGCA 
CGGTTGCACT ACGCGCGTCC CACCGACAAG CTGCGGCGGG CTGACGCCTT CCGGCTTATC 
GACAGCGCCC GGGCGGTCAT GCTCGATGCC CTGGACGCCG GCGGAACCAG CTTCGATTCC 
CTGTACGTAA ACGTCAACGG GGCCTCCGGA TATTTTGACC GGTCGCTCAA TGCCTACGGG 
CGCGAAGGCG AGCCCTGCAA ACGGTGCACG GCTGCGGGAA TCCACGCCAC CATCCGCCGT 
GAACAGTTCA TGAACCGGTC CTCCTACACG TGCCCGGTAT GCCAGCCGCG GCCCCGCAAC 
GGACGCTGGT AA

Protein sequence

MPELPEVEVV RRGLVSWVRG RTIESVDVLD PRSIRRHALG VEDFIGNLQG ATVSDVVRRG 
KFLWLPLVDG SAHQQAAGNG QAPPSRVALM AHLGMSGQLL MQDAGVPDEK HLKVRLHLSP 
SAGMPGQLRF VDQRIFGGLF VTALVPTDDG GPGGLAESPL PLIAGEASHI ARDPLDPAFS 
FDRFYQRLRA RKTGLKRALL DQGLVSGIGN IYADEALWRA RLHYARPTDK LRRADAFRLI 
DSARAVMLDA LDAGGTSFDS LYVNVNGASG YFDRSLNAYG REGEPCKRCT AAGIHATIRR 
EQFMNRSSYT CPVCQPRPRN GRW