Gene Sde_0337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sde_0337
Symbol
ID	3966518
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Saccharophagus degradans 2-40
Kingdom	Bacteria
Replicon accession	NC_007912
Strand	-
Start bp	421062
End bp	422129
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	54%
IMG OID	637919400
Product	A/G-specific DNA-adenine glycosylase
Protein accession	YP_525813
Protein GI	90019986
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.625053
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0756352
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAAA CACACCCATT TGCCCACAAG CTACTGGCTT GGTTTGATAA ACACGGCCGC 
AAAAACCTGC CGTGGCAGCA GCCCATTACG CCCTACCGCG TGTGGCTATC TGAAATTATG 
CTACAGCAAA CCCAAGTAGA AACAGTAATA CCCTACTTCA ATCGCTTTTT AGAGCGCTTC 
CCAAACCTAT TAGATTTAGC CAAAGCCCCA CAAGATGACG TGCTGCACCT ATGGACAGGC 
CTAGGCTACT ACGCCCGCGC CCGCAACCTA CACAAATGCG CACAAACCAT TTGGGAAAAC 
TACAACGGCG AATTCCCAAA CACCGTAGAA GAGCTGGCCA GCCTGCCCGG CATAGGCCCA 
AGCACCGCCG CCGCCATAGC CAGCATAGCC TTTGAACACC CCACCGCCAT ACTGGACGGC 
AACGTAAAAC GCGTACTTGC CCGCCACCAC ACCGTAGAAG GCTGGCCTGG GCAAAAACCG 
GTAGAAAACA TCCTGTGGCA ACACGCCCAC AGCCACATGC CGCAAAAACG CTGCCGCGAC 
TACACCCAAG CCATAATGGA TCTAGGCGCA ACCCTATGCA CACGCAGCAA ACCCCAATGC 
CACGCCTGCC CCGTAGCCCA AAGCTGCCAA GCCTATGCCC AAGGCAACCC GCTAGACTAC 
CCCGGCAAAA AGCCTAAAAA ACTCATGCCC GTAAAAGCGG TAAACATGCT TATGCTACGC 
AGCCCCACAG GCGATATATT TTTACAGCAG CGCCCACAGC AAGGCATATG GGGCGGCCTG 
TGGAGCCTGC CAGAAATAGA GCCAGAACAA AGCCCGCTAG AACACACCTT AGCCACCTAC 
GGCGAAGTAA CACAGCACCA ACAAATAGCC CAATTGCGCC ACACCTTTAG CCATTACCAC 
CTAGATATAA GCGCCCACTT GCTAGACTTA AAACGCGCAC CCGTGCAGGT AATGGAACAA 
AGCGATTGCG TTTGGTATAA GCTACACACC CCGCAGGCCC TTGGCCTTGC TGCACCGGTT 
AAAAAACTAC TGCAACTGGT AAAACAACAC CACTCGGAGA CCCCATGA

Protein sequence

MKQTHPFAHK LLAWFDKHGR KNLPWQQPIT PYRVWLSEIM LQQTQVETVI PYFNRFLERF 
PNLLDLAKAP QDDVLHLWTG LGYYARARNL HKCAQTIWEN YNGEFPNTVE ELASLPGIGP 
STAAAIASIA FEHPTAILDG NVKRVLARHH TVEGWPGQKP VENILWQHAH SHMPQKRCRD 
YTQAIMDLGA TLCTRSKPQC HACPVAQSCQ AYAQGNPLDY PGKKPKKLMP VKAVNMLMLR 
SPTGDIFLQQ RPQQGIWGGL WSLPEIEPEQ SPLEHTLATY GEVTQHQQIA QLRHTFSHYH 
LDISAHLLDL KRAPVQVMEQ SDCVWYKLHT PQALGLAAPV KKLLQLVKQH HSETP