Gene Arth_2977 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2977
Symbol
ID	4444499
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	3334942
End bp	3336363
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	65%
IMG OID	639690800
Product	glycoside hydrolase family protein
Protein accession	YP_832456
Protein GI	116671523
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2723] Beta-glucosidase/6-phospho-beta-glucosidase/beta-galactosidase
TIGRFAM ID	[TIGR03356] beta-galactosidase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCAGAACT CTGCGGCGTT GCAGAGCCTG GCCGAGCGGC TGGACCCCGA GTTCGTCCTG 
GGTGTGGCCG CCGCCGCGTT CCAGATCGAA GGATCCCTCA AGGCTGACGG GCGTGGCCCG 
TCCGGCTGGG ACGCCTTCGC CGAGAAACCC GGCAGCATTA TGGACGGCCA CTCCCCTGCC 
ATCGCCTGCG ACCATTACAA CCGTTCCGGC GAAGATGTGG CCCTGATGCG CGAACTGGGC 
ATCAACTCCT ACCGGTTCTC CATTTCCTGG CCCCGCATCC AGCCCGACGG CCGCGGCTCC 
TTCAACAGTC AGGGCCTGGA TTTCTACGAC CGGCTGATCG ACCAGTTGCT CGACGCCGGC 
ATCTCACCGA TGGCCACGCT GTATCACTGG GACACTCCCC TGCCGCTCGA GCACGGCGGC 
GGCTGGCTGA ACCGATCCAC TGCGGAGCGC TTCGCCGAAT ACAGCGCAGC AGCCGGAGAA 
CGGTTCGGGG ACCGCGTGGC GCAATGGGTC ACACTGAACG AGCCAGTGTC GGTGACACTG 
AACGGGTATG CACTGGGCGT CCATGCCCCG GGGCACAATC TCCTCTTCAA CGCCTTGCCC 
TCAATTCACC ATCAACTACT AGGGCACGGA CTCGCCGTCC AGGCCCTCCG GGCCGCGGGC 
GTCACCGGGG CCGTCGGCGT CACCAACCTG CACTCCCCTG TCCGGCCGGC AACCCGCAAG 
CCCGGCGACA GGATGGTGGC GCGAATCTTC GATATTTTGA TGAACCGCAT CTACGCGGAC 
CCCGTTCTGC TGGGCCGCTA CCCGAAACTG CCGCTGGTGG TCCGTCCGTG GTTCCGCTCC 
ATGGGCAAGA TCTCCGACGC CGACCTCCGG ACCATCCACC AGCCCCTGGA CTTCTACGGG 
CTCAATTACT ACTACCCCGT TAAAGTTGCC ATGGGCCGGG GGCCCGTCAG CGTACCGGCA 
AACAATTCCG GAGCGCTGGC CCAGTTGCCA TTCCACGAAG TGGGCTATCC GGAGTACGAG 
ACAACCGGCT TCGGCTGGCC TGTGGCACCT AAACACATCG GCATCCTGCT CCGCGAAATG 
AAGGACCGCT ACGGGGATGC TTTGCCGCCG CTGTACATCA CCGAGAGCGG AGCGAGCTTC 
CCGGAACCGG AGCATGTGAC CGGTCCGATT GCCGACTCCA ACAGAATCGA ATACCTGGCC 
AGCCACCTCG GCCATGCGCT GGCGGCCACG TCACCCGGCG GCCTGGCCGA GGACGTGAAA 
CTCCTGGGCT ACTACGTATG GACGCTGCTG GACAACTTCG AGTGGGCCGC TGGGTACTCG 
CAGCGTTTCG GCCTGATCCA CGTGGACTTT GACACGCTGG AGCGGACACC CAAGGAGTCC 
TTCTATTGGC TCCAGGCGCT GAGCCGGGCA CGGAAAGCCT GA

Protein sequence

MQNSAALQSL AERLDPEFVL GVAAAAFQIE GSLKADGRGP SGWDAFAEKP GSIMDGHSPA 
IACDHYNRSG EDVALMRELG INSYRFSISW PRIQPDGRGS FNSQGLDFYD RLIDQLLDAG 
ISPMATLYHW DTPLPLEHGG GWLNRSTAER FAEYSAAAGE RFGDRVAQWV TLNEPVSVTL 
NGYALGVHAP GHNLLFNALP SIHHQLLGHG LAVQALRAAG VTGAVGVTNL HSPVRPATRK 
PGDRMVARIF DILMNRIYAD PVLLGRYPKL PLVVRPWFRS MGKISDADLR TIHQPLDFYG 
LNYYYPVKVA MGRGPVSVPA NNSGALAQLP FHEVGYPEYE TTGFGWPVAP KHIGILLREM 
KDRYGDALPP LYITESGASF PEPEHVTGPI ADSNRIEYLA SHLGHALAAT SPGGLAEDVK 
LLGYYVWTLL DNFEWAAGYS QRFGLIHVDF DTLERTPKES FYWLQALSRA RKA