Gene Arth_1230 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_1230
Symbol
ID	4446259
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	1349496
End bp	1350944
Gene Length	1449 bp
Protein Length	482 aa
Translation table	11
GC content	66%
IMG OID	639689038
Product	polysaccharide deacetylase
Protein accession	YP_830724
Protein GI	116669791
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGA GGCATGAACT GCCGGGGGAA CAGGGCGGTC CGCCCGGTTC CGGTTTGATG 
CGGCAGCGGA AACGGACAAC GCTCTGGGCA GTCTCATGGC TGGCCGGGCT GGCACTCCTG 
ACGGGATCCG CCGCCCTGGT ACCCAAGGCC GGCCCGGGGC CGGCCCGGGA TGCGCAGGGG 
CCCCTGAAGA ATTTTGCGGC ACCCGTGGAC ACGAGCCTCG CGCTGACCAC CGTCACGCTG 
ACGTTCGACG GCGGCAGGGC CAGCCAGCTG GCCGCCGCGG AGACCCTTCG AAGCCACGGG 
CTACGGGGGA CGTTCTTCGT CAACTCGGGT TTCATGGGGG CCAAGGACTA CATGACGGTG 
GAGGATCTGC ACAAGCTGGC CGCGGACGGC AACGAGATTG GCGGGCACAC CGCAACCCTT 
GCAGACTTGA CGGCACTTGA ACCTGCGGAA GCCACCCGAC AGGTCTGCAA TGACCGGACC 
AACCTCACCG ACTGGGGCTT CAAGGTCACA TCTTTCTCCT ACCCCTTTGC CGCAAAGTCG 
CCAGAGGCGG AGGCGATGGT GGCCGGCTGC GGCTACAACA GCGCGCGCAG CCAGGGTGAC 
CTCCGCAGCA AGCTGGGGTG CGCCGATTGC GCCGTGTCCG AAACCGTCCG GCCGGCGGAC 
CCGTTCAGCA CGAGGTCGAC GCCGGAGATC GGGTCCGCGT GGACCATCGC GGACCTCCAG 
CAGTCAGTCA TGGACGCTGA AACCACCGGA GGGTGGCTGC AGCTGAGCTT CTTCGACATC 
GATGACAGCG GGAGTCCCCG GTCTGTCAGC CCTGCACTCT TCAACGACTT CGTCTCGTGG 
CTGGTGACCC GCACAGACGA AGGAACCACC GCCATCCGCA CCGTGCACGA TGTGATTGGT 
GGCGGGGCAA AACCCGCAGT TCCGGGACCT GTTGCTCCGC CTGCGCCGCC CGGCACCAAC 
GCGCTCCGCA ACCCGGGACT GGAAACAGCC GGAAGGTACG GCCTTCCCGA GTGCTGGCAG 
GTTTCCTCCT ACGGCGAGAA TTCACATGTC CTGAGCACGC TGACTCCCGG GCACTCGGGC 
ACTATTGCCC GGCGCCTCGA CGTCACGGGC TACACATCCG GGGACGCAAA GCTGCTCCCA 
GTCATGGACC TGGGGGCGTG CGCACCGAGC GTCGTCGCCG GCCACAGCTA TACGCTGCGC 
GCATGGTACG CCTCCACTTC ATCAACGCAG TTCGAGTTGT ATTACCGCAA CAAGGTTGGC 
ACCTGGACCT ATTGGACAGC CAGCCCATGG TTTCCCGCCA GCGCTGCCTA CCGGCAGGCT 
GAGTGGACTG CACCGCCGGT GCCGGCAGAC GCCGTCGGCA TCAGTTTTGG CTTGAATCTG 
TTCAGCGACG GGGAGCTGGC TACGGATGAC TACGAGATGT TCGACACGGG GGCGCCGCCC 
GCCCCGTAG

Protein sequence

MSQRHELPGE QGGPPGSGLM RQRKRTTLWA VSWLAGLALL TGSAALVPKA GPGPARDAQG 
PLKNFAAPVD TSLALTTVTL TFDGGRASQL AAAETLRSHG LRGTFFVNSG FMGAKDYMTV 
EDLHKLAADG NEIGGHTATL ADLTALEPAE ATRQVCNDRT NLTDWGFKVT SFSYPFAAKS 
PEAEAMVAGC GYNSARSQGD LRSKLGCADC AVSETVRPAD PFSTRSTPEI GSAWTIADLQ 
QSVMDAETTG GWLQLSFFDI DDSGSPRSVS PALFNDFVSW LVTRTDEGTT AIRTVHDVIG 
GGAKPAVPGP VAPPAPPGTN ALRNPGLETA GRYGLPECWQ VSSYGENSHV LSTLTPGHSG 
TIARRLDVTG YTSGDAKLLP VMDLGACAPS VVAGHSYTLR AWYASTSSTQ FELYYRNKVG 
TWTYWTASPW FPASAAYRQA EWTAPPVPAD AVGISFGLNL FSDGELATDD YEMFDTGAPP 
AP