Gene AnaeK_4038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	AnaeK_4038
Symbol
ID	6785508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. K
Kingdom	Bacteria
Replicon accession	NC_011145
Strand	+
Start bp	4562788
End bp	4563753
Gene Length	966 bp
Protein Length	321 aa
Translation table	11
GC content	77%
IMG OID	642765507
Product	DNA-formamidopyrimidine glycosylase
Protein accession	YP_002136372
Protein GI	197124421
COG category	[L] Replication, recombination and repair
COG ID	[COG0266] Formamidopyrimidine-DNA glycosylase
TIGRFAM ID	[TIGR00577] formamidopyrimidine-DNA glycosylase (fpg)

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCGGAGC TGCCGGACAT CGAGGTCTAC GTCGAGGCGC TCGCGGCGCG GGTGCTGGGT 
CAGCCGCTGG AGCGCATCCG GCTGGGGAAC CCCTTCCTGC TCCGCTCCGC CGACCCGCCG 
CTCGCGGAGG CGGAGGGGCG GCGCGTCGCC GCGGTGCGCC GGCAGGGCAA GCGCCTCGTC 
CTGGCGCTCG ACGGCGACCT CTACCTGGCG CTGCACCTCA TGATCGCGGG CCGGCTGCAC 
TGGAAGGACC CCGGCGCGCG GCTCCCGGGC AAGGCGGGGC TGGCGGCGTT CGACTTCCCC 
AACGGCACGC TCGTCCTCAC CGAGGCCGGC ACGAAGCGGC GCGCCGCGCT GCACCTGGTG 
CGCGGCGCCG CGGCGCTCGC CGCGCTGGAC CGCGGCGGCA TCGAGCCGCT CGACGTGGAC 
CTCGCCGCGT TCGCCGCCGC GCTCCGGCGC GAGAACCACA CGCTGAAGCG CGCGCTGACG 
GACCCCTCGC TCTTCTCCGG CATCGGCAAC GCCTACTCGG ACGAGATCCT GCACCGGGCC 
CGCCTGTCGC CGGTCGCGCT GACCTCGCGG CTCGGCGACG CAGAGGTGGC GCGCCTGTTC 
GAGGCCACGC GCGAGGTGCT GACCGGCTGG ACGGCGCGGC TCCGCGAGGA GGCGGGGAGC 
GGCTTCCCCG AGGGCGTCAC CGCGTTCCGC GAGGGCATGG CCGTGCACGG ACGGCACCGC 
CAGCCGTGCC CGGTGTGCGG CACCGCGGTG CAGCGCATCG TGCGCGCGGA GAACGAGGTG 
AACTACTGCC CGCGCTGCCA GACCGGCGGG CAGATCCTCT CGGACCGCTC CCTCGCCCGC 
CTGCTGAAGC ACGACTGGCC GCGGACGGTG GACGAGCTGG AGCGCAACCC GGCGCTCGGC 
CTCCGGCCCG CGCCGGGGCC GGCCGGGCCG CGATCCAAGG GGCCGCCGCG CCGCCCGTCG 
CGCTGA

Protein sequence

MPELPDIEVY VEALAARVLG QPLERIRLGN PFLLRSADPP LAEAEGRRVA AVRRQGKRLV 
LALDGDLYLA LHLMIAGRLH WKDPGARLPG KAGLAAFDFP NGTLVLTEAG TKRRAALHLV 
RGAAALAALD RGGIEPLDVD LAAFAAALRR ENHTLKRALT DPSLFSGIGN AYSDEILHRA 
RLSPVALTSR LGDAEVARLF EATREVLTGW TARLREEAGS GFPEGVTAFR EGMAVHGRHR 
QPCPVCGTAV QRIVRAENEV NYCPRCQTGG QILSDRSLAR LLKHDWPRTV DELERNPALG 
LRPAPGPAGP RSKGPPRRPS R