Gene Arth_0833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0833
Symbol
ID	4446671
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	901964
End bp	903070
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	67%
IMG OID	639688640
Product	inositol 2-dehydrogenase
Protein accession	YP_830331
Protein GI	116669398
COG category	[R] General function prediction only
COG ID	[COG0673] Predicted dehydrogenases and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.000914593
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGGCCTACG TCACCCTGAA TCCCGCCGGA GTCCCGGCCC TAGTACGGAT CGGACTCATC 
GGCTCCGGCT GGATGGGGGC GTTCCACGCC GAAAGTATCG CCCGCCGCGT CCCTGGCGCC 
GTCCTCGCGG CCATCGCCGA CCCGAACGTT GAATCCGCGG AAGCTTTGGC CCGCTCCCTG 
GGCACCGTCA AGGTGACGCC CAACGCCGAG GACATCCTGG CGGATCCGGA GATCGACGCC 
GTGATCATCG CGAGCCCGGC GCGCTTCCAC TCCTCCCTCA TCGCGCAGGC TGCCGCCGCC 
GGAAAACACG TCTTCTGCGA GAAACCCGCC GGCCAGGGGC TCGACGAACT GGACGCCGCA 
CTCGCCGCGG TGGAAGCGGC GGGCGTGCAC TTCCAGATCG GGTTCAACCG CCGGTATGCG 
GAGGATTTCC AGGCCGCCAA GAAAGACCTT GCCGCAGGTG TTGCCGGCAC GCCGCAGCTC 
CTGCGTTCGC TGACGCGCGA CCCCGGCAAC GGAAATATCC CGAACGCGGC CAGGGTCCCG 
GCATGGACCA TCTTCTTGGA AACCCTGATC CATGACTTCG ACACGCTCAA CTGGTTCAAC 
GAAGGCGCCG AGCCCGTGGA GGTCTACGCG GTCGCGGACG CCCTGGTGGA GCCGGGCCTC 
CATGATCAGG GCTTCCTGGA CACAGCAGTA GTCACCATCC GCTACAGCAA CGGAGCCATA 
GCCGTGGCGG AAGCAAACTT CAGCGCACTG TACGGATACG ACATCCGCGG GGAGGTTTTC 
GGCTCGAAGG GAATGGTCCA GGCCGGCCGT GCCACGGAGA CCGCAGCCCG CCGCTACACC 
GCCGAGGGAC TGTCCGCCGA TACACCGCGG CTCAACGTCG AACTGTTCAG GCAGGCCTAC 
ACGGATGAAC TCGCCGATTT CGCCGACGCG GTGCGCGCAC GGCGTGACGG CGTGCCGCCG 
TCGTCGTCCG CCTTTACCCT CAGGCCGGGG GCCGCCGACG CCAGGCGTGC GCTGGCGATG 
GCGCTGGCCT GCATCGAGTC AGTCAAGCTG GGCGCCCCGG CGGCCGTGGC AGCATCAAAA 
GCCGATTATG CGGAGGATAA AGCATGA

Protein sequence

MAYVTLNPAG VPALVRIGLI GSGWMGAFHA ESIARRVPGA VLAAIADPNV ESAEALARSL 
GTVKVTPNAE DILADPEIDA VIIASPARFH SSLIAQAAAA GKHVFCEKPA GQGLDELDAA 
LAAVEAAGVH FQIGFNRRYA EDFQAAKKDL AAGVAGTPQL LRSLTRDPGN GNIPNAARVP 
AWTIFLETLI HDFDTLNWFN EGAEPVEVYA VADALVEPGL HDQGFLDTAV VTIRYSNGAI 
AVAEANFSAL YGYDIRGEVF GSKGMVQAGR ATETAARRYT AEGLSADTPR LNVELFRQAY 
TDELADFADA VRARRDGVPP SSSAFTLRPG AADARRALAM ALACIESVKL GAPAAVAASK 
ADYAEDKA