Gene Arth_2543 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2543
Symbol
ID	4444951
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2853293
End bp	2854426
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	66%
IMG OID	639690360
Product	glucose sorbosone dehydrogenase
Protein accession	YP_832022
Protein GI	116671089
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0277395
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCGGG AGGGAACGGG GCCTGCGTCC AGGCCTGCAC TCCGCCCAAT GCCTGCCGCC 
GCCCTCGTAT GGACGCTGGT TTTGTCCGCC TGCACCGGAG GCGGGGACGG CGGTCCCACG 
GGCACCACGG GTTCAACCAC GGGCGGCGAC GAGGCGTCCC GGGAACCCCG CGTACTCCGG 
ACGGTGGAAG GACTGCAGCT GCCCTGGTCG GCCGTGTTCC TGCCGGATGG CACAGCCCTC 
ATTTCTGAAC GTGACAGCGG CGACGTCAAA GCGGTCAAAG ACGGCGGGAC TACGCTGCTA 
GGCAACATCC CCGGCGTTGT TCCCGGAGGT GAAGGCGGCC TCCTGGGGCT GGCGGTGTCA 
CCGAGCTACG TTTCGGACAA GTCGATCTTT GCCTATTTCA CCGCCCGGGC GGACAACAGG 
ATTGCCCGCC TCACGCTGAC TGAGGCCGAG CCCGGGGGCG CGCTGAGGCT TGGGCCGCCG 
GAGATAATCT TCTCCGGCAT CCCCAAGGCG TCAACCCACA ACGGTGGCCG CATACGTTTT 
GGGCCGGACG GGAACCTCTA TGTGGGAACC GGGGATTCGC AGCGGCGCGA ACAGCCGCAG 
GACCCGAACG CGCTGGGCGG CAAGATCCTC CGGATCACTG CTGACGGCAA GCCGGCGCCG 
GGTAACCCGT TTGGCGACAA CCCGGTCTAC AGCCTTGGGC ACCGGAACGT GCAGGGCCTC 
GACTGGGATG ACGCGGGCAG GCTGTGGTCC AGCGAGTTCG GGCCCACTGT GGACGACGAA 
CTGAACCTGA TCCAGCCGGG CGGAAATTAC GGCTGGCCGG AGGTCACCGG GGCACCCGGC 
AAGCCGGGCT TTATTGATGC CAAAGTGGTA TGGCCTTCCA CCGCGGAATC TTCCCCGAGC 
GGACTCGAGG TCGTCGGGTC CACGGCTTAC CTCGGGGCCC TACGGGGCCA GCGGCTGTGG 
GCCATTCCCC TTGACGGCGA AAATGCAGGC AAACCTGTGA GCCATTTCAC AGCGAGGTTC 
GGCCGGATCC GCGACGTTTC GCTCGCCCCT GACGGCACTT TGTGGATGCT CACCAACAAC 
CAAAACCCTG ATTCTGCGCT GATTTTGGCG CCTCCGGCCA AGGCAGGGAG CTGA

Protein sequence

MNREGTGPAS RPALRPMPAA ALVWTLVLSA CTGGGDGGPT GTTGSTTGGD EASREPRVLR 
TVEGLQLPWS AVFLPDGTAL ISERDSGDVK AVKDGGTTLL GNIPGVVPGG EGGLLGLAVS 
PSYVSDKSIF AYFTARADNR IARLTLTEAE PGGALRLGPP EIIFSGIPKA STHNGGRIRF 
GPDGNLYVGT GDSQRREQPQ DPNALGGKIL RITADGKPAP GNPFGDNPVY SLGHRNVQGL 
DWDDAGRLWS SEFGPTVDDE LNLIQPGGNY GWPEVTGAPG KPGFIDAKVV WPSTAESSPS 
GLEVVGSTAY LGALRGQRLW AIPLDGENAG KPVSHFTARF GRIRDVSLAP DGTLWMLTNN 
QNPDSALILA PPAKAGS