Gene Daro_3591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3591
Symbol
ID	3568255
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3846820
End bp	3848826
Gene Length	2007 bp
Protein Length	668 aa
Translation table	11
GC content	65%
IMG OID	637682064
Product	transketolase
Protein accession	YP_286790
Protein GI	71909203
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0021] Transketolase
TIGRFAM ID	[TIGR00232] transketolase, bacterial and yeast

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0287801
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGTCA GCAACCTCCC CAAGTTTTCT CCCCTGACCG GCGCCATCCG CGCCCTCGCC 
ATGGATGCAG TCCAGCAGGC CAACTCCGGG CATCCCGGCG CCCCAATGGG CATGGCTGAA 
ATCGCCGAAG TCCTCTGGCG CCGCCACCTG CGTCACAACC CGGCCAACCC GCACTGGGCC 
GACCGCGACC GCTTTGTGCT GTCGAACGGC CACGGCTCGA TGCTGCTCTA CGCGCTGCTG 
CACCTGACCG GCTACGATCT GTCGATCGAT GACCTGAAGA ATTTCCGCCA GTTGCACGCC 
AAGACCCCGG GCCATCCGGA ATACGGCTAC ACGCCGGGCA TTGAAACGAC CACCGGCCCG 
CTCGGCCAGG GCATCACCAA CGCCGTCGGC TTCGCGCTGG CTGAAAAGGT GCTGGCCGCC 
GAGTTCAACA AACCCGGCCA CGAAATCGTC AATCACCACA CCTATGTCTT CCTGGGCGAC 
GGCTGCCTGA TGGAAGGCGT GTCGCATGAA GCCTGCTCGC TGGCCGGCAC GCTCGGCCTC 
GGCAAGCTGA TCGCCTTCTG GGACGATAAC GGCATCTCGA TCGACGGTCA CGTCGAAGGC 
TGGTTCACCG ACGACACCCC GAAGCGCTTT GAAGCCTACG GCTGGCATGT CGTCGCCCAC 
GTCGACGGCC ATGATTCCGA CGCCATAGAA CGCGCCCTGC TCGCCGCCAA GGCAGTCACC 
GACAAGCCCA GCCTGATCTG CTGCAAGACG ACCATCGGCG CCGGCTCGCC GAACAAGCAG 
GGATCGCACG ACTGCCACGG CGCCCCGCTC GGCAAGGACG AAATCGCTGC CGCCCGCGCT 
TACATCGGCT GGAACCACCC GGCCTTCGAA ATCCCGGCCG ACATTTACGC CGCCTGGAAT 
CGCAAGCCGG CCGGTGCTGT TTTTGAGGAA AACTGGAGCA CCCGTTTCGC TGCCTACCGC 
ACCGCCTTCC CGGCCGAAGC CGCCGAATTC GAGCGCCGCG TCATCAAGAA CGAACTGCCA 
ACCAACTGGG CAGCGACCAA GGCCGCCTAC ATCGCCACCT GCCGCGACAA GGCCGAGAAC 
ATCGCCACCC GAAAGGCTTC GCAGAACGCC ATTGCCGCAC TGGTCCCGGC CGTGCCGGAA 
ATCTTCGGCG GCTCAGCCGA CCTGGCCGGC TCCAACCTGA CCTTCGTCAA GGGCAGCAAG 
GGCGTCACCC GCACCGAGGG CGGCAACTAT TGCTACTACG GTGTGCGCGA ATTCGGCATG 
ACCGCCATCG CCAACGGCAT CGCGCTGCAT GGTGGCCTGG TGCCCTACAC CGCGACTTTC 
CTGGTCTTCT CCGACTACGC CCGCAACGCC ATCCGTATGG CGGCGTTGAT GAAGCAGCGC 
CAGATCATGG TCTATACCCA TGACTCCATC GGTCTCGGCG AAGATGGCCC GACGCACCAG 
CCGGTCGAGC ATATCCCGTC GATGCGCATC ATCCCGAACC TCGACGTCTG GCGCCCGGCC 
GACGCGACCG AAACGGCCAT TGCCTGGACC GCAGCGGTCG AGCGCAAGGA TGGCCCGAGC 
ATCCTCGCCC TGTCGCGCCA GAACCTGCCG ACCGTCACCC AGCAGGCGGC CGATGCCGAC 
ATCGCCAAGG GCGGCTATGT ACTGGCCGAA GCGGATGGCG AAGCGCAGAT CACCTTCATT 
GCCACCGGCT CCGAAATCAA GCTGGCGCTC GACGCCCAGG CTGCACTGGC CGGCGAAGGG 
ATCAAGACCC GCGTCGTCTC GATGCCCTGC TCCAATGTTT TCGACCGCCA GAGCGCCGAA 
TACAAAGCCT CGGTGCTCGG CGCCTGCAAA AAACGCATCG CCATCGAAGC CGCTCACCCG 
GACTTCTGGC GCAAGTACGT CGGCCTGCAT GGCGCCGTGA TCGGTATCGA CCGCTTCGGC 
GAGTCCGCAC CGGCCGGCCA GCTGTTCGAC CTGTTCGGTT TCACCGTCGC CAACGTCGTC 
AAGACGGCCA AGGCACTGTT GTCCTGA

Protein sequence

MSVSNLPKFS PLTGAIRALA MDAVQQANSG HPGAPMGMAE IAEVLWRRHL RHNPANPHWA 
DRDRFVLSNG HGSMLLYALL HLTGYDLSID DLKNFRQLHA KTPGHPEYGY TPGIETTTGP 
LGQGITNAVG FALAEKVLAA EFNKPGHEIV NHHTYVFLGD GCLMEGVSHE ACSLAGTLGL 
GKLIAFWDDN GISIDGHVEG WFTDDTPKRF EAYGWHVVAH VDGHDSDAIE RALLAAKAVT 
DKPSLICCKT TIGAGSPNKQ GSHDCHGAPL GKDEIAAARA YIGWNHPAFE IPADIYAAWN 
RKPAGAVFEE NWSTRFAAYR TAFPAEAAEF ERRVIKNELP TNWAATKAAY IATCRDKAEN 
IATRKASQNA IAALVPAVPE IFGGSADLAG SNLTFVKGSK GVTRTEGGNY CYYGVREFGM 
TAIANGIALH GGLVPYTATF LVFSDYARNA IRMAALMKQR QIMVYTHDSI GLGEDGPTHQ 
PVEHIPSMRI IPNLDVWRPA DATETAIAWT AAVERKDGPS ILALSRQNLP TVTQQAADAD 
IAKGGYVLAE ADGEAQITFI ATGSEIKLAL DAQAALAGEG IKTRVVSMPC SNVFDRQSAE 
YKASVLGACK KRIAIEAAHP DFWRKYVGLH GAVIGIDRFG ESAPAGQLFD LFGFTVANVV 
KTAKALLS