Gene Sbal_3039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal_3039
Symbol
ID	4845447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS155
Kingdom	Bacteria
Replicon accession	NC_009052
Strand	+
Start bp	3563227
End bp	3564318
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	50%
IMG OID	640120287
Product	A/G-specific adenine glycosylase
Protein accession	YP_001051390
Protein GI	126175241
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000495773
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAATCTA CAGCCTCCTT CGCTACACGT ATCGTCTCTT GGTACGACAA TCACGGTCGT 
AAAACCCTCC CTTGGCAGCA AGATAAAACC CCATATAGCG TATGGGTTTC TGAAATCATG 
CTGCAACAAA CTCAGGTTGC GACTGTTATT CCCTATTACC TTAAATTTAT GGCGCGTTTC 
CCCGATGTGT TAGCACTTGC TAACGCGCCA GATGATGAGG TGTTGCATCA TTGGACTGGC 
CTTGGGTATT ACGCTAGAGC GCGTAATCTA CATAAAGCAG CCAAGATGAT CCGCGACGAT 
TATCAGGGAT TATTTCCAAC GGATTTTGAG CAAGTACTTG CGCTGCCTGG CATTGGCCGC 
TCAACGGCAG GCGCAGTATT GTCACTGTCT CTTGGCCAGC ATCACCCGAT CCTCGACGGT 
AACGTCAAAC GCGTGTTAGC AAGACACGGC GCCATAGCAG GTTGGCCGGG GCAAAAAACG 
GTCGAAGCGC AGCTTTGGCA GCTAACTGAC ACGTATACGC CGCAGCAAGA TATTCAGAAA 
TATAATCAAG CCATGATGGA TATCGGCGCC AGTATTTGTA CTCGTAGCAA ACCTAACTGC 
GCCGCTTGCC CTGTGGCGAT TGATTGCAAA GCTCAGCTGA TTGGCAGACA AACCGATTTC 
CCTGGCAAAA AGCCTAAAAA AACCATACCG ACCAAAGCGG CGTGGATGTT AGTGCTAATG 
CAAGACAACC AAGTGTTTTT AGCTAAACGT CCGCCAGCGG GAATTTGGGG CGGACTTTGG 
TGTTTCCCTG AGTTTGCCAC CCACGCCGCA CTTGAAACCC ACCTCGAAGA GCAAGGGTTT 
GCAGGGCAAC AACTCGAATG GCTAACTGGC TTTAGGCACA CGTTTAGCCA CTTCCATTTA 
GATATTCAGC CCATGATGCT TAATTTAGAT AACACCCACG GCAATAAAGA GAGCGTGGGC 
GCTGTCATGG AACAAAATCA GTCTCTCTGG TATAACATAA GTCATCCTTC CAAAGTGGGA 
CTCGCCGCCG CCACCGAGCG CGTGCTAGCC AATTTGGGAT CACTAGTTCA ATCCGCAGTC 
AGTAAGGAAT AA

Protein sequence

MKSTASFATR IVSWYDNHGR KTLPWQQDKT PYSVWVSEIM LQQTQVATVI PYYLKFMARF 
PDVLALANAP DDEVLHHWTG LGYYARARNL HKAAKMIRDD YQGLFPTDFE QVLALPGIGR 
STAGAVLSLS LGQHHPILDG NVKRVLARHG AIAGWPGQKT VEAQLWQLTD TYTPQQDIQK 
YNQAMMDIGA SICTRSKPNC AACPVAIDCK AQLIGRQTDF PGKKPKKTIP TKAAWMLVLM 
QDNQVFLAKR PPAGIWGGLW CFPEFATHAA LETHLEEQGF AGQQLEWLTG FRHTFSHFHL 
DIQPMMLNLD NTHGNKESVG AVMEQNQSLW YNISHPSKVG LAAATERVLA NLGSLVQSAV 
SKE