Gene Daro_0064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0064
Symbol
ID	3568055
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	74598
End bp	75635
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	60%
IMG OID	637678493
Product	A/G-specific DNA-adenine glycosylase
Protein accession	YP_283293
Protein GI	71905706
COG category	[L] Replication, recombination and repair
COG ID	[COG1194] A/G-specific DNA glycosylase
TIGRFAM ID	[TIGR01084] A/G-specific adenine glycosylase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0000000000000461825
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.645907
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCCACCC CGAACCCGTT CACCGAACAA TTGATCGCCT GGCAGAAGAT CGCCGGGCGC 
CATGACCTGC CCTGGCAGAA TACCTGCGAT CCTTACCGGG TCTGGCTTTC CGAAATTATG 
TTGCAGCAAA CACAGGTCAG CACGGCGACC CCCTACTACC TGCGTTTCCT GAGCAGTTTT 
CCCGATGTAA CAGCACTGGC TACCGCGCCG ATCGAAGTCG TGATCGAGCA CTGGGCCGGC 
CTTGGCTATT ACGCAAGAGC ACGCAACCTC CATCGCTGTG CTCAGCAGAT TGTCACGGTC 
TATGCCGGGA GCTTTCCGGA CTCTGTAGAA AAACTCGCAG AATTGCCTGG TATCGGCCGG 
TCAACTGCCG CTGCAATTGC GGCATTCTCA TTCGGAAAAC GGGCCGCAAT CCTCGACGGT 
AACGTCAAAC GGGTACTGTG TCGGCAATTC GGCATCGATG GCTTTCCCGG TTCGGTGACT 
ATCGACCGCA AGCTGTGGAC GCTGGCCGAA AGCCTGCTGC CAGAACGGGA TATCGAGGTA 
TACACACAGG GCTTGATGGA TCTCGGTGCC ACGTTATGTA CCCGGAGCAA GCCACGTTGC 
GGCGACTGTC CTGTTGCTGC GGCCTGTATC GCCCGATGCG AAGGCAGGCA GGCTGAGCTG 
CCAACGGCAA AACCACGCAC CAAGGTGCCT GAACGAACCG CGACCTACGT GTTGCTCAGC 
GATGGGCACC GTCTGCTACT TGAGCGACGC CCCCCAAGCG GTCTGTGGGG TGGCCTGCTG 
GTGCCGCCCG AGGGCGAGCC GGATCAAGTC GCCGCCCGCT TTGGCTTGCA ACTGGGCGAG 
CAGTCGAAAC TGCCTGCACT GAAGCATACC TTTACGCATT TCAAGCTGAC GCTGGAACCG 
GTGCTGTGCC GCATTGAGCC GCGCACCGAC CTGGGTGAGG CGGGACTCGA GTGGGTCAAT 
ATCGACAAAG CAGCCCAAGC CGGCGTACCG ACCCCGATCC GGAAACTGAT CAAGCAGGTT 
GCCAGCGCAG GGGGCTGA

Protein sequence

MATPNPFTEQ LIAWQKIAGR HDLPWQNTCD PYRVWLSEIM LQQTQVSTAT PYYLRFLSSF 
PDVTALATAP IEVVIEHWAG LGYYARARNL HRCAQQIVTV YAGSFPDSVE KLAELPGIGR 
STAAAIAAFS FGKRAAILDG NVKRVLCRQF GIDGFPGSVT IDRKLWTLAE SLLPERDIEV 
YTQGLMDLGA TLCTRSKPRC GDCPVAAACI ARCEGRQAEL PTAKPRTKVP ERTATYVLLS 
DGHRLLLERR PPSGLWGGLL VPPEGEPDQV AARFGLQLGE QSKLPALKHT FTHFKLTLEP 
VLCRIEPRTD LGEAGLEWVN IDKAAQAGVP TPIRKLIKQV ASAGG