Gene Daro_3626 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3626
Symbol
ID	3567992
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3899298
End bp	3901370
Gene Length	2073 bp
Protein Length	690 aa
Translation table	11
GC content	66%
IMG OID	637682099
Product	transketolase
Protein accession	YP_286825
Protein GI	71909238
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0021] Transketolase
TIGRFAM ID	[TIGR00232] transketolase, bacterial and yeast

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	0.560894
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.611761
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATCGCA ACCAGACCGA AATCACCTTC CGCCGCGAAC TGGCCAACGC CGTCCGCTTT 
CTGGCCATCG ATGCCGTCAA TCAGGCCAAG TCCGGACACC CTGGCGCGCC GATGGGCATG 
GCCGACATCG CCGAAGTGCT GTGGCGTGAC CATCTCAAGC ACAATCCAGC CAACCCGCAG 
TGGGCGGACC GCGACCGCTT CGTACTGTCG AACGGTCACG GCTCGATGCT GCTCTACGCG 
CTGCTTCACC TGACCGGCTA CGACCTCAAT ATCGATGACC TCAAGAACTT CCGCCAGTTC 
GGCAGCCGCA CCGCCGGCCA TCCGGAAGTC GGCCACACGC CCGGCGTCGA GACGACCACC 
GGGCCGCTCG GCCAGGGCCT GACCAACGCC GTCGGCATGG CGCTGGCCGA AAAGCTGCTG 
GCCCAGCGCT ACAACCGGCC AGGTTGCGAG ATCGTCGATC ACCGGACTTG GGTTTTCGTC 
GGTGACGGCT GTCTGATGGA AGGCATCAGC CACGAAGCCT GTTCGCTGGC CGGCGTCTGG 
GGCCTCGACA AGCTGACCTG CTTCTACGAC GACAACGGGA TTTCCATCGA CGGCCACGTC 
AAAGGCTGGT TCCGCGACGA CACCCCGGCC CGCTTCCGCG CCTACGGCTG GCATGTTGTC 
GGGCCGATTG ACGGCCATGA CTCGGTGGCG CTGTCCGCGG CCATTGCCGA AGCCAAGGCC 
GTCACCAGCC AACCGACCCT GATCGTCTGC CGCACGCAGA TCGGTTGGGG TTCGCCGAAC 
AAGGCCGGTT CGCACGACGT TCATGGCGCG CCGCTCGGCG CCGATGAAAC GGCCGCCACC 
CGTGCCGCGC TTGGCTGGTT GCATCCGCCG TTTGAAGTGC CGGACAGCCT GCGCGCCGCG 
TGGAATGCCC AGTCTACTGG CGCCACTGCC GAAGCCTCAT GGCTGGCCAG GTTCGCCGCT 
TACCGCACCG AGTATCCGGA ACTCGCCGCC GAATTCGAAC GCACGCAGGC CGGCGGTCTG 
CCGGAAAAAT GGCCGGAAAT TAAAAGCGAA CTGCTGGCCA CGGCCGGCCG CAAGGAAGGC 
GCCGTCGCCA CCCGCAAGTC GTCGCAGAAC TGCCTCGATT GGCTGGTCGA CCGCGTGCCC 
GAACTACTTG GCGGCTCGGC CGACCTGACC GGCTCCAACC TGACCGCCGG CAAAGGCAGC 
GTGGCCCTGC ATGAAGTACC CCAAGGGCAC TTCCTTCGGG GCGCTGGTGA GCGGCAGGCC 
AACTACATTT CCTACGGCGT CCGCGAATTC GGCATGACGG CGATCATGAA CGGTGTCGCC 
CTGCACGGCG GGTTGATTCC CTACGGCGGC ACCTTCGCCG TCTTCTCCGA CTACGCCCGC 
AACGCGATCC GGATGAGCGC CCTGATGCAG CAGCGCGTCG TCCATGTCCT GACCCACGAT 
TCCATCGGCC TCGGCGAGGA TGGCCCGACC CACCAGCCGG TCGAGCACGC CAGCAGCCTG 
CGCATCATTC CCGGCCTCGA CCTGTGGCGC CCGTGCGACG AGCTGGAAAC AGCCATCGCC 
TGGGGCGCCG CGCTCGAGCG CCAAAACGGA CCTTCCACCC TCTTTTTGTC GCGTCAAAAC 
CTGCCGCAAT ACGGCGGCGC GGCGAGCCGG GCGGAAGGTG CCAGCCGCGG CGGCTACGTG 
CTCTCCGAAG CCGACGGCCC GCTGCAGGCA GTGATCATCG CCACCGGCTC GGAAGTCGCC 
ATCGCCATGC AGGCGCAGGC CATTCTGAAA ACCGGCGGCG TTGCAGTGCG TGTCGTCTCG 
ATGCCCTGCA CGCGGCGCTT CGACCAGCAG CCTTCGACGT GGAAGAAGCT CGTGCTGCCG 
CCGGAAGTCT GCCGCGTCGC CATCGAAGCC GGCCAGACCG ATTTCTGGCG AAAGTACGTT 
GGCCTCGACG GCGACGTGCT CGGCCTCGAC GAATTCGGCG CCTCGGCCCC GGCCCCGGTG 
CTTTACGAAC ACTACGGCCT GACCGCGGAC AACCTGGCGC AGACGGTGTT GCGCACCATC 
GTCAGTGCCG GGGGCAGTGA TGGTGACTTC TGA

Protein sequence

MDRNQTEITF RRELANAVRF LAIDAVNQAK SGHPGAPMGM ADIAEVLWRD HLKHNPANPQ 
WADRDRFVLS NGHGSMLLYA LLHLTGYDLN IDDLKNFRQF GSRTAGHPEV GHTPGVETTT 
GPLGQGLTNA VGMALAEKLL AQRYNRPGCE IVDHRTWVFV GDGCLMEGIS HEACSLAGVW 
GLDKLTCFYD DNGISIDGHV KGWFRDDTPA RFRAYGWHVV GPIDGHDSVA LSAAIAEAKA 
VTSQPTLIVC RTQIGWGSPN KAGSHDVHGA PLGADETAAT RAALGWLHPP FEVPDSLRAA 
WNAQSTGATA EASWLARFAA YRTEYPELAA EFERTQAGGL PEKWPEIKSE LLATAGRKEG 
AVATRKSSQN CLDWLVDRVP ELLGGSADLT GSNLTAGKGS VALHEVPQGH FLRGAGERQA 
NYISYGVREF GMTAIMNGVA LHGGLIPYGG TFAVFSDYAR NAIRMSALMQ QRVVHVLTHD 
SIGLGEDGPT HQPVEHASSL RIIPGLDLWR PCDELETAIA WGAALERQNG PSTLFLSRQN 
LPQYGGAASR AEGASRGGYV LSEADGPLQA VIIATGSEVA IAMQAQAILK TGGVAVRVVS 
MPCTRRFDQQ PSTWKKLVLP PEVCRVAIEA GQTDFWRKYV GLDGDVLGLD EFGASAPAPV 
LYEHYGLTAD NLAQTVLRTI VSAGGSDGDF