Gene Arth_4027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_4027
Symbol
ID	4447828
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4546441
End bp	4547421
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	66%
IMG OID	639691858
Product	transketolase, central region
Protein accession	YP_833502
Protein GI	116672569
COG category	[C] Energy production and conversion
COG ID	[COG0022] Pyruvate/2-oxoglutarate dehydrogenase complex, dehydrogenase (E1) component, eukaryotic type, beta subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACCA TGACCATCGC CAAGGCCATC AACGAGGGCC TGCGCGCGAC GCTGAACAAC 
AACCCCCGCA CGCTGCTCAT GGGCGAGGAC ATCGGCCCGC TCGGCGGCGT CTACCGCGTC 
ACTGACGGGC TGATCGGCGA ATTCGGCGCC GACCGCGTCG TGGACACCCC GCTGGCCGAA 
TCCGGAATCA TCGGAACCGC GATCGGACTT GCCCTCAGCG GCTACCTGCC GGTCTGCGAG 
ATCCAGTTCG ACGGCTTCGT TTTTCCGGGC TTCAACCAGA TCACCACCCA GCTGGCCAAG 
ATGCATGCCC GCAGCAACGG AAACCTCACC GTGCCGGTGG TCATCCGCAT CCCGTACGGC 
GGCGGCATCG GCTCGATTGA ACATCACTCC GAGTCCCCGG AGGCGCTGTT CGCCCACACG 
GCCGGCCTGC GCATCATCAC CCCTTCCAAC CCGCATGACG CCTACTGGAT GATCCAGCAG 
GCGGTCGACT GCCAGGACCC GGTTATCGTC TTTGAGCCGA AGCGGCGCTA CTGGCTCAAG 
GGTGACGTAG ACACGGAGTC GCCCGGCGCT TCGGCGGATC CGTTCACGGC CCACGTGCTG 
CGCGAAGGCG CCGACGCCAC CGTGGTCGCT TACGGTCCGC TGGTCCCGGT GGCACTCGCT 
GCGGCCAGTG CCGCTGCCGA GGACGGCCAC AGCGTTGAAG TGATCGACCT CCGGTCCATC 
TCGCCCATTG ACTTCGACAC CGTTACCGAG TCCGTCAAGA AGACGGGACG CCTGATCGTG 
GCCCATGAGG CACCGACGTT CGGTGGCATC GGCGGCGAAA TCGCGGCCCG TGTGAGCGAG 
CGTGCGTTCC TGTCCCTCGA AGCGCCGGTG ATCCGTGTTG GCGGCTTCCA CATGCCCTAC 
CCCGTGGCCA AGGTGGAAGA GGACTACCTG CCGGACATCG ACCGCATCCT CGAGGCGCTG 
GACCGCGCCC TTGCCTACTG A

Protein sequence

MTTMTIAKAI NEGLRATLNN NPRTLLMGED IGPLGGVYRV TDGLIGEFGA DRVVDTPLAE 
SGIIGTAIGL ALSGYLPVCE IQFDGFVFPG FNQITTQLAK MHARSNGNLT VPVVIRIPYG 
GGIGSIEHHS ESPEALFAHT AGLRIITPSN PHDAYWMIQQ AVDCQDPVIV FEPKRRYWLK 
GDVDTESPGA SADPFTAHVL REGADATVVA YGPLVPVALA AASAAAEDGH SVEVIDLRSI 
SPIDFDTVTE SVKKTGRLIV AHEAPTFGGI GGEIAARVSE RAFLSLEAPV IRVGGFHMPY 
PVAKVEEDYL PDIDRILEAL DRALAY