Gene Plim_3349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Plim_3349
Symbol
ID	9140065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Planctomyces limnophilus DSM 3776
Kingdom	Bacteria
Replicon accession	NC_014148
Strand	+
Start bp	4335465
End bp	4336610
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	53%
IMG OID
Product	A/G-specific adenine glycosylase
Protein accession	YP_003631361
Protein GI	296123583
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.574146
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAGA CAAAGTTTCA AAAGCAACTT CTCGCCTGGT ATGCAAAGCA TGGTCGCCCG 
TTGCCGTGGC GAGCCTCACA TGATCCTTAT TCGATCTGGA TCAGTGAGAT CATGCTGCAA 
CAGACCACCG TGACCGCTGT GATCCCTTAC TTCGAACGAT TCATGGCGAA ATTCCCCAGT 
GTGCAGGCGC TGGCCAGTGC TCCGGAAGAA GAGGTGCTCA AACTGTGGGA GGGGTTAGGT 
TACTACTCAA GAGCCCGCAA TCTGCATCAG TCTGCCCGAG TGTTGATGGA AAGATACCAA 
GGGGTTTTTC CGCAAAGTGT CGAGCAATTG CTCGAGTTGC CCGGGATTGG TCGATATACG 
GCTGGCGCCA TTTCGAGCTT TGCTTTTCGC CTGCCGGCTC CCATTGTCGA AGCCAATACC 
CAGCGGTTGT ATGCCCGCAT TCTGGGATAT GATGGCGACT TGAAAAATGC AGCAGGACAA 
AAAGCCTTAT GGGGATTCGC AGAATCGATT GTTTCAGGGA AAGAACCCGA TCTGATCAAT 
CAGGCCCTCA TGGAACTGGG CTCACTTGTT TGTAAACCCA TCGACCCCTT GTGCGATCAA 
TGCCCGGTCC AGCAGCATTG CCGCGCATTT CAGGAAGCAA GGCAAGCCGA GATTCCCCGA 
GCACAGGCCA GACCAGTCAT TACACCGCTG GTTGATGCCA CATTGCTGAT CGAGTATCAG 
GGGGAGCTAT TTCTCCGGCA ACGCGAGAAG CCTGAGCGAT GGGCCGGATT ATGGGATTTT 
CCACGCTATA CGCTTTTTGA TCCCGAGAAT ACCAGCGAAG AGTTTCAGAA AGAAAAAGAC 
GTCTCGACAT CAGCACTGGC CTTGTCACTC AAGGCTCGTG TGCAGGAACA ATTGGCGGTA 
CATCCAGGCG AAGTCACTGA ATTTTCACGG CTGACTCATG GAGTGACTCG CTATCGCATC 
ACTCTGCATG CCTTTGGCTG CGATCTCTCG GATGGAGTGG CCAGCAGACA AAGCAAAGCA 
CTCTATGAAC AGCTCAAGTC GCATGGCGGG TGGTTTGGGT GTGAATCGCT CGATTCGCTG 
GCCGTGCCCG TGACCACTCG AAAGCTGGTG AAGCAGTGGC AGAAGCTCAA GAACATGATG 
CGATGA

Protein sequence

MQKTKFQKQL LAWYAKHGRP LPWRASHDPY SIWISEIMLQ QTTVTAVIPY FERFMAKFPS 
VQALASAPEE EVLKLWEGLG YYSRARNLHQ SARVLMERYQ GVFPQSVEQL LELPGIGRYT 
AGAISSFAFR LPAPIVEANT QRLYARILGY DGDLKNAAGQ KALWGFAESI VSGKEPDLIN 
QALMELGSLV CKPIDPLCDQ CPVQQHCRAF QEARQAEIPR AQARPVITPL VDATLLIEYQ 
GELFLRQREK PERWAGLWDF PRYTLFDPEN TSEEFQKEKD VSTSALALSL KARVQEQLAV 
HPGEVTEFSR LTHGVTRYRI TLHAFGCDLS DGVASRQSKA LYEQLKSHGG WFGCESLDSL 
AVPVTTRKLV KQWQKLKNMM R