Gene Arth_0834 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0834
Symbol
ID	4446672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	903067
End bp	904101
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	68%
IMG OID	639688641
Product	inositol 2-dehydrogenase
Protein accession	YP_830332
Protein GI	116669399
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0396008
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGGACG TCATTCTTGG CCTGGTCGGA GTAGGGCGGA TCGGCGTCAT GCACGCCAAC 
AACATCGCCG CGCTGAACGG GGTCCTCAAC GCGGAGGGCA TCAACGTCAG GCTCCGGCTC 
ACCGACGTCG CGAAAGAGCA TGCGCGGACC GTGGCGGCCG GGCTCGGCGC CGAGTTCCTT 
CCCTCGGTGG AGGCACTCCT GTCCTCCGGG CTGGACGGAC TGGTCGTTGC CACCGGGACT 
GCCACCCACC CGGAACTGAT CAAGGCAGGC GTGGACGCCG GCATCCCGGT GTTCTGCGAG 
AAACCGGTGG CCTTGAATGT GGCGGATGCC CTGCCGGTGC TGGACTACAT CCGGGACCGG 
AAGGGCGTGG TGCAGATCGG GCACCAGCGC CGCTTCGACG CCGGCTACCT TGAAGCACGG 
CGCGCTTACC AGGCCGGCGA GCTGGGCTGG ATCCACTCGC TACGGGCCGT CACGTGCGAC 
ATGGCACCCC CTCCGGTGGA GTTCCTTGCC AGCTCCGGCG GCCTCTTCCG GGACTGTTCC 
GTCCATGACT TCGACATCCT GCGCTGGCTG ACCGGCCGGG AGATCGTCGA GGTGTACGCC 
AGGGGCTCCA ATAACGGCGA CCCGGCGATC GGCGAAGTGG GGGACGTGGA CACCGCGCTC 
GCGCTGGTAA CGTTCGACGA CGGCACGGTC GGGACGGTCT CCGCCACCCG GTACAACGGG 
GCAGGCCACG ACGTCCGGCT CGAAATCCAG GGTTCGCGCC GTTCGCTGAT GGTGGGCCTG 
GATGACAAGA CGGCGCTGGC ATCGGCCGAA ACCGGCGTCC ACTTCCCCGC GGGCGAGCCG 
CACAAGACCT TCGCTGAACG CTTCGACCAG GCGTACCGCT CCGAGATGGC GGCTTTCGTG 
GAGCTGATCC TGGGCCGCCG GGAGAACCCG TGCACGGCAG AGGACGCCGT GGCTGCCTCC 
CGCGTTGCGG ACGCCGCCCA GGAATCGCTG GCGACGGGCG TTCCGGTCCG CGTGGCACAG 
AAAGTGGCCC GCTAA

Protein sequence

MKDVILGLVG VGRIGVMHAN NIAALNGVLN AEGINVRLRL TDVAKEHART VAAGLGAEFL 
PSVEALLSSG LDGLVVATGT ATHPELIKAG VDAGIPVFCE KPVALNVADA LPVLDYIRDR 
KGVVQIGHQR RFDAGYLEAR RAYQAGELGW IHSLRAVTCD MAPPPVEFLA SSGGLFRDCS 
VHDFDILRWL TGREIVEVYA RGSNNGDPAI GEVGDVDTAL ALVTFDDGTV GTVSATRYNG 
AGHDVRLEIQ GSRRSLMVGL DDKTALASAE TGVHFPAGEP HKTFAERFDQ AYRSEMAAFV 
ELILGRRENP CTAEDAVAAS RVADAAQESL ATGVPVRVAQ KVAR