Gene Arth_3892 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3892
Symbol
ID	4445093
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	4383341
End bp	4384432
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	65%
IMG OID	639691717
Product	glycosidase, PH1107-related protein
Protein accession	YP_833367
Protein GI	116672434
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2152] Predicted glycosylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTTCCC CCCACACTTC CGCACTCCCC ACCGTTCCCT TCACCCTCAC CCGCGCGGGG 
GTCATCATGT CCCCGGAAGA GGGCAACGAC TTTGAAGCGG AAGGCGTCCT CAACCCCGCC 
AGCGGCCGGG GCCCCGACGG CGAGCTGTAC CTTCTGCCCC GGCTCGTCGC CAAGGGTAAT 
GTATCCCGCG TCGGCCTGGC CAAGGTTGTC ATCGAAGACG GCGTTCCCAC CGGAGTGGAA 
CGCCAAGGCG TAGTGCTCGC CCCGGACGAG GGCTGGGAAC GCGGCCTGAA CAACGCCGGT 
ACCGAGGACC CCCGCACTAC CTGGGTACCC TCCCTGGGCA AGCACCTGAT GACCTATGTC 
GCCTACGGTC CGCTGGGCCC GCGGCTCGCT TTCGCGCATT CCGAGGACCT CCGCAGCTGG 
GAACGCCTGG GCCCGTGCTT CTTCGAATAC AAGGCCGAGC TCTCCATGGA CCTGAACCTG 
TTTCCCAACA AGGACGCCGT GTTCTTCCCG GAACCTGTCA ACGACCCTGA TGGCATTCCC 
TCCTATGCGA TGCTGCACCG CCCCATGTGG GACCTGGGCT GGATCCGTGA CGGCGAAGGC 
GAGCACCTGC CCGCCGGCGT GACGGACAAC CGACCCGGCA TCTGGATCTC CTACGTGGCC 
GTGGAAGACG TGGAAAAGGA CATCCGCAAC CTGGTGCACA TGGGCAAGCA CACCCTCGTT 
GCCCTCAGCG AGTTCCCGTT CGAGGAACTG AAGATCGGTG GCGGTCCCGC GCCGATCCGC 
GTCGATGAAG GCTGGCTGCT CATCCACCAC GGTGTGGCCG GTGCCCTGGA GAAGTCCGCG 
TTCGACCACC AGCAGAAGGT CAACTACACC GCGGCCGCCA TGATCCTGGA CGCCAGTGAC 
CCCAGCAAGG TCATTGCCCG CAGCGACAAG CCGCTGCTGG CACCGGAAAC CGAAGACGAG 
ATCTCCGGCA TCGTGCCCAA CGTGGTGTTC CCCACCGCCA TCGAGGAAGT GGACGGCCAG 
CTGTTCGTGT TCTACGGCAT GGCCGACTCG AAGATCGGCG TGGCCAGGCT GGACCGCGTT 
CCGGCCAACT AG

Protein sequence

MTSPHTSALP TVPFTLTRAG VIMSPEEGND FEAEGVLNPA SGRGPDGELY LLPRLVAKGN 
VSRVGLAKVV IEDGVPTGVE RQGVVLAPDE GWERGLNNAG TEDPRTTWVP SLGKHLMTYV 
AYGPLGPRLA FAHSEDLRSW ERLGPCFFEY KAELSMDLNL FPNKDAVFFP EPVNDPDGIP 
SYAMLHRPMW DLGWIRDGEG EHLPAGVTDN RPGIWISYVA VEDVEKDIRN LVHMGKHTLV 
ALSEFPFEEL KIGGGPAPIR VDEGWLLIHH GVAGALEKSA FDHQQKVNYT AAAMILDASD 
PSKVIARSDK PLLAPETEDE ISGIVPNVVF PTAIEEVDGQ LFVFYGMADS KIGVARLDRV 
PAN