Gene Arth_2337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2337
Symbol
ID	4445102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	2626341
End bp	2627843
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	66%
IMG OID	639690146
Product	polysaccharide deacetylase
Protein accession	YP_831817
Protein GI	116670884
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00797389
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTTGGT CGAATCAGCC TGTCCGCAAG CCCGCGCGTT GCGTGGCGGA TCCCCCTGAA 
CCATTGGCCG AAGGCCGGCA CGGCAGGCGC TGGGTTGCAG TCCTGGGTGC CCTGCTGCTT 
GCTGTCAGCA CAGTGGCGGG CGTGGCCGGT ACTTCGAAGG CTGCGGCGCC AACCATCGTC 
AGCCTGACGT TCGACGACGG CCTCGGCAGC CAGTTGGCCG CGGCGCAGGA GCTGAAAGCC 
CACGGACTGG TGGGAACTTT CTTCATCACC ACGTCCTTCG TGGGCCAGTC CGGGTTCCTC 
ACCCAGGCAA ACCTGAACAC TCTCGTGGCC GACGGCAATG AGATCGGCGG CCACAGCGTG 
ACCCACCCGG ACATGACAAC GCTCAGCGCA GCGGCCGCCA GCGCGGAGGC CTGCAACAGC 
AAGTCGACCC TCGAGGCCTG GGGCTTCACC GTCCGGAACT TCGCCTACCC CTTCGCGGCG 
GTGAATCAGA CAGCCCAAAA CGCCGTCAGC GGCTGCGGGT ACAGCAGTTC CCGTGGCCTC 
GGCGACATCC GTTCTCCCGC CAGCTGCGCC GACTGCCCTG TCGCCGAGAC GCTCCCGCCG 
CAGGAACCCA TGGTCACCAA GGCGCCGGAC CAGGTGGCCG CCACATGGAC CCTGGCGGAC 
CTGCAGGCGA CAGTCACCAA CGCCGAGACA ACCGGCGGCT GGCTGCAGCT GACGTTCCAC 
GAGATTGCGA ACGGAACGGA TCCGTCGCTG TCCATCAGCC CCGCGCTGTT CAAAGAGTTC 
GTCACGTGGC TGGCCGCGCG GACAGCAAAC GGTACGACGT CGGTGCGTAC AGTGGCGCAG 
GCATTGGGCC AGTCCCCCGT GACGTCACCG CCTCCCTCGC CTTCACCGTC ACCATCGCCG 
ACCCCGTCAC CCTCGCCGGC GGGCTCGTTT ACGGATGTTC CCGCGAACTC GCAGTTCTAC 
ACGGAGATCA GCTGGCTCGC CTCGCAAGGG ATTTCCACTG GCTGGGTTGA AGCCAACGGC 
ACCAGCACGT ATCGCCCGGC GCTCGCCGTC AACCGGGATG CCATGGCTGC CTTCATGTAC 
CGACTCGCCG GGAGTCCGGC GTACACACCG CCGGGCACCT CCCCGTTTAT CGATGTGACG 
CCGCAGACGC AGTTCTATAA GGAAATCGCC TGGCTCGCTT CGAAGGGCAT TTCCACCGGC 
TGGGACGAAG GAAACGGCGC CAAGTCGTAC CGGCCGCTGC AGACCGTGAA CCGTGATGCG 
ATGGCAGCCT TCATGTACCG CTTTGCCGGC AGCCCTGCCT ACAACGCCCC GGGCGCCTCC 
CTCTTCACTG ACGTGGTCCC GCAGACGCAG TTCTACAAGG AAATCAACTG GCTCGCGTCG 
ATGAACATCT CCACCGGCTG GGTCGAAGGG AACGGCACCA GGACCTTCCG TCCCGTCCAG 
TCCGTGAACA GGGACGCCAT GGCGGCCTTC ATGTACCGCT ACAACAACGC CTTCCCTGCG 
TAA

Protein sequence

MRWSNQPVRK PARCVADPPE PLAEGRHGRR WVAVLGALLL AVSTVAGVAG TSKAAAPTIV 
SLTFDDGLGS QLAAAQELKA HGLVGTFFIT TSFVGQSGFL TQANLNTLVA DGNEIGGHSV 
THPDMTTLSA AAASAEACNS KSTLEAWGFT VRNFAYPFAA VNQTAQNAVS GCGYSSSRGL 
GDIRSPASCA DCPVAETLPP QEPMVTKAPD QVAATWTLAD LQATVTNAET TGGWLQLTFH 
EIANGTDPSL SISPALFKEF VTWLAARTAN GTTSVRTVAQ ALGQSPVTSP PPSPSPSPSP 
TPSPSPAGSF TDVPANSQFY TEISWLASQG ISTGWVEANG TSTYRPALAV NRDAMAAFMY 
RLAGSPAYTP PGTSPFIDVT PQTQFYKEIA WLASKGISTG WDEGNGAKSY RPLQTVNRDA 
MAAFMYRFAG SPAYNAPGAS LFTDVVPQTQ FYKEINWLAS MNISTGWVEG NGTRTFRPVQ 
SVNRDAMAAF MYRYNNAFPA