Gene CHU_1766 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	CHU_1766
Symbol
ID	4186838
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cytophaga hutchinsonii ATCC 33406
Kingdom	Bacteria
Replicon accession	NC_008255
Strand	-
Start bp	2072826
End bp	2073929
Gene Length	1104 bp
Protein Length	367 aa
Translation table	11
GC content	40%
IMG OID	638071765
Product	DNA-3-methylpurine glycosylase
Protein accession	YP_678375
Protein GI	110638166
COG category	[L] Replication, recombination and repair
COG ID	[COG4335] DNA alkylation repair enzyme
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.0802128
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0268874
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAACCAT TAAAATACGT TTATTCACCG GCCTTTATAG ATTCGTTAAT TGCTTTTTTG 
AAAAAGGTTC ATCCGTCTTT GAATAAAAAA GCATTCGCTG CTGCTGTTTT TGATGCCGAA 
TGGGATAACC GTGAATTGAA GCAGCGGATG AAGCATCTGG CACATGTGCT GCATCAGCAG 
CTGCATCAAG CCTATGCAAA GGATATTGAA ACAATTATAG CGTTGGTGCA TTTGTTAAAA 
GCGGACAGAG ATAACCATCA GAGTTTCGAA TATTTATTTT TGGCCGAATA TGTTGAAATA 
TATGGTCAGC ACGATGTGGT GCTATCCATG AAAGCAATTG AAGAAATTAC ACAATATACC 
AGCTGTGAAT TTGCGATCCG TCCTTTTCTG ATCAAACATC CGGAGAAGGT AATGAAGTAC 
ATGCTTAAAT GGTCGAAACA TAAACATGCC AGTGTAAGGC GTTTTTCCAG CGAAGGCTGC 
CGACCCCGGT TGCCATGGGG TATGGCGCTT CCTGCATTCA AAAAAGACCC GTCCTTGATT 
TTACCTGTTC TTGAAAATCT GAAAACAGAT GAATCGTTGT ATGTGCGTAA GAGTGTAGCA 
AACAATTTAA ATGATATCGC AAAGGATAAT CCGGAGGTGG TGATTGACCT GATTAAAAAA 
TGGCAGGGCG TTTCGCCATA CACAGACTGG ATCATTAAGC ACGGTGCCCG TACACTGCTG 
AAAAAAGCAC ATGCAGAAGT GCTGGGTTTA TTTGGCTTAC AGACAACACT TGCTTGTACC 
GTTTCAAATC TGACCCTGAT AAAAAATAAG ATCAAAATAG GAGATACGTT GTCTTTCGCT 
TTTGATCTGG ATACCGGCTC CAAAGCAGAT GCGAAGCTGC GGATCGAATT TGCCGTTTAT 
TATGTAAAAG CAGGCGGGAA GCCCAGCCGC AAACTTTTTA AGATTACAGA AAATACTTAC 
CAGAAAGGTA AACGGGTTTC ATTTAACAAA AAACTTTCAT TTAAAGATTT AACTACAAGA 
AAACATTATG CGGGGAAGCA TACCATTGCT ATTGTTGTAA ATGGAAATGA ATTGATAGCC 
TCCGATTTCC ATCTTCTGGG CTAA

Protein sequence

MEPLKYVYSP AFIDSLIAFL KKVHPSLNKK AFAAAVFDAE WDNRELKQRM KHLAHVLHQQ 
LHQAYAKDIE TIIALVHLLK ADRDNHQSFE YLFLAEYVEI YGQHDVVLSM KAIEEITQYT 
SCEFAIRPFL IKHPEKVMKY MLKWSKHKHA SVRRFSSEGC RPRLPWGMAL PAFKKDPSLI 
LPVLENLKTD ESLYVRKSVA NNLNDIAKDN PEVVIDLIKK WQGVSPYTDW IIKHGARTLL 
KKAHAEVLGL FGLQTTLACT VSNLTLIKNK IKIGDTLSFA FDLDTGSKAD AKLRIEFAVY 
YVKAGGKPSR KLFKITENTY QKGKRVSFNK KLSFKDLTTR KHYAGKHTIA IVVNGNELIA 
SDFHLLG