Gene Daro_3701 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3701
Symbol
ID	3567913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3978823
End bp	3979836
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	67%
IMG OID	637682174
Product	transketolase, central region:transketolase, C-terminal
Protein accession	YP_286900
Protein GI	71909313
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	58
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.86607
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCACAC TCACCCTGAA CGATGCCATC GGCCTGGCCC TGGCCGAGGA AATGCGCCGT 
GACCACAAGG TCATTGCCTT CGGCGAAGGT ATTGCCACCA AGCGCCATGA ACTCGTTACC 
GAATTCGGCG CCCTGCGTGT CCGCAACACG CCGCTGGCCG AGGGGATCAT CGCCGGCACG 
GCAGCCGGTG CCGCCGCCGG AGGCCTGCGC CCGGTCGCCG ATCTGCTCTT CGCTCCCTTC 
CTCTGCTATG CCATGGACGA GCTGGTCAAC AGCGCCGGCA AACTGCGCTA CATGTCGGGC 
GGCCAATTCA GCTTCCCGCT GGTCGCGCTG GCCATGACGG GGGCCGGCTG GGGCGTTGGC 
GCCCAGCACA ACCACAACGT CGAAGCCTGG TTCGTGCATA GCCCCGGCCT CAAGGTCGTC 
ATGCCAAGCA ACCCGGCCGA CGCCCGCGCG CTGCTCAAGA CGGCCATCCG CGACGACAAC 
CCGGTCGTTT TCCTGCTTGA CATCGGCCTG CTCTATCAAC CCGGCGAAGT GCCAAGCGAA 
GCCGTGCCGA TACCGCTCGG TCAGGCGACC ACGGTTCGCG CCGGCACGGA TGTCAGCCTC 
ATTTCCTACG GCAAGACCGT GCATCACTGC GCGCAGGCGG CAGGAAGCCT GGCGGCCGAA 
GGAATCGCCG CCGAAGTCAT CGACCTGCGC AGCCTGAAGC CGCTCGACGA GGCTGCCATC 
CTCGCCACCG CCCGGAAGAC CGGGCGCGTC GTCGTCGTCC ATGAAGCCAA CCGCCTGTGC 
GGTGTCGGCG CCGAAATCGC CGCGCTAATC GCCGAACAGG CCTTTGCCAG CCTCAAGGCG 
CCCGTTGTCC GCCTCGGCGG CCCGGACGCC CCGGTGCCAT CCAGCTTCCC GCTCGAACAG 
GCCACCGTGC CACAAGCCGA TGCCATTGCT GCCGCGGCAA GGCAACTTTG CGCATCGCGT 
CGAGCCTTAA CCCACCCCCC AACGGAGAAC TCAAAATGCG CCTTACCACA CTGA

Protein sequence

MPTLTLNDAI GLALAEEMRR DHKVIAFGEG IATKRHELVT EFGALRVRNT PLAEGIIAGT 
AAGAAAGGLR PVADLLFAPF LCYAMDELVN SAGKLRYMSG GQFSFPLVAL AMTGAGWGVG 
AQHNHNVEAW FVHSPGLKVV MPSNPADARA LLKTAIRDDN PVVFLLDIGL LYQPGEVPSE 
AVPIPLGQAT TVRAGTDVSL ISYGKTVHHC AQAAGSLAAE GIAAEVIDLR SLKPLDEAAI 
LATARKTGRV VVVHEANRLC GVGAEIAALI AEQAFASLKA PVVRLGGPDA PVPSSFPLEQ 
ATVPQADAIA AAARQLCASR RALTHPPTEN SKCALPH