Gene Nham_3227 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nham_3227
Symbol
ID	4032006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrobacter hamburgensis X14
Kingdom	Bacteria
Replicon accession	NC_007964
Strand	-
Start bp	3556401
End bp	3557579
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	68%
IMG OID	637971640
Product	A/G-specific adenine glycosylase
Protein accession	YP_578422
Protein GI	92118693
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.599367
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCTAG CAGGTGCGGC CAACAAGCGA AAGAAACCAG CGATCGCCGC TGCCGCTCCG 
CGTTCGCAGG ACAGGCCCGG ACTCCTGCTC GCCTGGTACG ATTTGCACCG CCGCCGCCTG 
CCGTGGCGCG CGCTGCCCGG CAAAGCCGTG GATCCTTATT TCGTCTGGCT GTCCGAGATC 
ATGCTGCAGC AGACCACCGT GAAGGCGGTC GGGCCCTATT TCGAAAAGTT CCTGGCGCGC 
TGGCCGGACG TTGACGCCAT GGCGCGCGCC TCGCTCGACG ATGTCCTGCG GATGTGGGCC 
GGGCTCGGTT ACTATTCGCG CGCGCGCAAT CTCCATGCCT GCGCGGTGGC GGTGCGGCGC 
GATCATGGCG GCACGTTTCC CGATACGGAA GAAGGTTTGC ACGCGCTGCC GGGGATCGGT 
CCGTACACGG CGGCTGCGAT CGCCGCGATC GCGTTCGGCC GCCGCACCAT GCCGGTCGAC 
GGCAACATCG AGCGGGTAGT GTCGCGCCTG TTCGCGGTGG AGGAGGCGCT GCCGAAGGCG 
AAGCCGCGCA TTCGGGAGCT TGCGGCGACG CTGCTCGGGC CATCGCGATC CGGCGACGTG 
AAGACACGCG CCGGTCGCGA CGGCAAGAGC CGCGCTGGCG ACGGCAAGAG CCGCGCTGGA 
GATTCCGCGC AGGCGCTGAT GGATCTCGGC GCCACCATCT GCACGCCGAA GAAGCCGGCC 
TGCGCGCTAT GTCCGCTCAG TGACGATTGT GCTGCACGGT TGCGCGGCGA TCCGGAGACG 
TTTCCGCGCA AGGCGAAGAA GAAGGCGGGC GCGTTGCGGC GCGGCGCGGC CTTCGTGGTG 
ACGCGCGGCG ATCATCTGCT GGTTCGCACC CGCCCCGAAA AGGGTCTGCT CGGCGGCATG 
ACGGAAGTGC CGACGTCGGT CTGGCTCGCC GCGCAGGATG ATGCGGCCGC GCTGAAGCAG 
GCGCCGTCAC TCGGGAGCGC CTCGCGCTGG CGGCGCAAGG CCGGCACGGT CACGCACGTC 
TTCACGCATT TTCCGCTGGA GCTTACGGTC TATACCGCGA CCATTCCGGC AGGTGCCCGC 
GCGCCCAAGG GTATGCGCTG GGTGCCGATC GCAACGCTGA AGGATGAAGC GTTGCCGAAT 
CTGATGCGCA AGGTCATCGC GCACGGGTTA GAGCAATGA

Protein sequence

MTLAGAANKR KKPAIAAAAP RSQDRPGLLL AWYDLHRRRL PWRALPGKAV DPYFVWLSEI 
MLQQTTVKAV GPYFEKFLAR WPDVDAMARA SLDDVLRMWA GLGYYSRARN LHACAVAVRR 
DHGGTFPDTE EGLHALPGIG PYTAAAIAAI AFGRRTMPVD GNIERVVSRL FAVEEALPKA 
KPRIRELAAT LLGPSRSGDV KTRAGRDGKS RAGDGKSRAG DSAQALMDLG ATICTPKKPA 
CALCPLSDDC AARLRGDPET FPRKAKKKAG ALRRGAAFVV TRGDHLLVRT RPEKGLLGGM 
TEVPTSVWLA AQDDAAALKQ APSLGSASRW RRKAGTVTHV FTHFPLELTV YTATIPAGAR 
APKGMRWVPI ATLKDEALPN LMRKVIAHGL EQ