Gene Daro_3706 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3706
Symbol
ID	3567918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3984113
End bp	3985057
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	65%
IMG OID	637682179
Product	hypothetical protein
Protein accession	YP_286905
Protein GI	71909318
COG category	[F] Nucleotide transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0352] Thiamine monophosphate synthase [COG1051] ADP-ribose pyrophosphatase
TIGRFAM ID	[TIGR00586] mutator mutT protein [TIGR00693] thiamine-phosphate pyrophosphorylase

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.461385
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAAGA TCGTCGAAGT TGCCGCTGCC GTCATGCTGC GTGCCGATGG CCGCGAATTC 
CTGCTCGCCC AGCGCCCGGA AGGCAAGGTT TACGCTGGCT ACTGGGAATT CCCCGGCGGC 
AAGGTCGAAC CCGGCGAAAC CGTCCGCCAG GCACTGATCC GCGAACTGCA GGAGGAACTG 
GGCATCACGG TCACCGCCTG CTCGCAGTGG CTGACCCGGC AATTTACCTA CCCGCATGCC 
ACCGTCCGCC TGAACTTCTG GCGAGTCACC GCCTGGGATG GCGAGATCGG CATCACCGCA 
CCGCTCGAAC ATTCGGCAGT CGAGTGGCAA AAAACAGGAG GGGCCGCCAG CGTCGCCCCC 
ATCCTGCCGG CCAACGACCC GATCCTGAAA GCCCTGTCGT TGCCGACAAC GATGGCCATC 
ACGATGGCTG AAAGCGAAGG CACCGAGCGC CAGCTGGAGC GCCTCGAAGA AGCCCTGAAT 
GCCGGCCTGC GCCTGATCCA GATTCGCGAC AAAAGCCTGC CGCCAGCCCA GCGCCTGTGG 
TTTGCCGAAA CCGTGCTGCA ACTGGCCCGC AGCCATGGCG CCACGGTTGT CATCAACGAC 
GACGAAGCAC TGGCCAGACG CATCGGCGCC GATGGTGTCC ACCTGTCAGC GGCACGCTTG 
GCCGCTTGCC AGCAACGCCC GGACTTCACC TGGGTGGGCG CCTCCTGCCA TAGCGCGGAG 
GAAATCGTCC GGGCCGGCGA ACTTGGTCTG GATTACGCGC TGCTGGGTCC GGTAATGCCA 
ACGCCAACCC ATCCTGAATC AACCGGGCTC GGCTGGACTG AATTCGAAGG GCGACTGGCC 
GGCAATACGC TGCCGGTGTT TGCGCTGGGC GGCATGAAGC CGGGAATGCT GGCCGAGGCC 
CAAGGCCACG GCGCCCACGG ATTGGCGCTT ATGCGCGGCT GGTAG

Protein sequence

MTKIVEVAAA VMLRADGREF LLAQRPEGKV YAGYWEFPGG KVEPGETVRQ ALIRELQEEL 
GITVTACSQW LTRQFTYPHA TVRLNFWRVT AWDGEIGITA PLEHSAVEWQ KTGGAASVAP 
ILPANDPILK ALSLPTTMAI TMAESEGTER QLERLEEALN AGLRLIQIRD KSLPPAQRLW 
FAETVLQLAR SHGATVVIND DEALARRIGA DGVHLSAARL AACQQRPDFT WVGASCHSAE 
EIVRAGELGL DYALLGPVMP TPTHPESTGL GWTEFEGRLA GNTLPVFALG GMKPGMLAEA 
QGHGAHGLAL MRGW