Gene Arth_0256 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0256
Symbol
ID	4447277
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	269187
End bp	272204
Gene Length	3018 bp
Protein Length	1005 aa
Translation table	11
GC content	66%
IMG OID	639688052
Product	alpha amylase, catalytic region
Protein accession	YP_829757
Protein GI	116668824
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTTGCAG CACTGGTTGC CGCAGCCGCT CTGGCGGCCC CCGCCCAGGC GGCCCCGGAG 
CCGAAAGGCC CGGGTGCGCC GTCGGCCTCC CACTCGCTCC GCGCCCCGGT GACGGACGAG 
AACTTCTACT TCGTGATGGC GGACCGTTTC AGCAACGGAA GCAGCGCGAA CGACGACGGC 
GGACTGGGCT CCGATCCGAT GGTCTCCGGC TACGACCCGA CCAAGAAGGG CTTCTACAAC 
GGCGGCGACC TCAAGGGCCT GCTGGACAAG ATCGACTACA TCCAGGGCCT GGGCACCACG 
TCCATCTGGC TGACGCCCAG CTTCAAGAAC AAAGCGGTCC AGCCTGAGGA CAAATCTGCC 
GGTTACCACG GGTACTGGGT AACCGACTTC ACCCAGATCG ACCCGCATCT GGGCACCAAC 
GCCGAACTGA AGGCGTTGAT CGACGAGGCG CATTCACGCG GCATGAAGGT CTACTTCGAC 
ATCATCACCA ACCACACCGC GGACGTGATC GGCTACAAGG AAGGCGCCCG CACGGCGTAC 
AAGTCCAAGG ACGTCGCGCC ATACAAAACA GCCGACGGCG AGGTTTTCGA CGACCGCGAC 
TACGCTGGCA CGGACACCTT CCCGGAGCTG GATCCAGCCA CTTCGTTCCC CTACACGCCG 
GTCCTGGACG AGGCCGAGAA GGACCTCAAG GTTCCGGGCT GGCTCAACAA TCCCGCGCTC 
TACCACAACC GCGGCGACAC CACCTTCCAG GGCGAGGACT CCTTTTACGG TGACTTCTTC 
GGCCTGGACG ACCTCTTCAC CGAGAACCCG GAAGTCGTTG ACGGCATGAC GAAGGTCTAC 
GAAGACTGGA TCAAGGATTT CGGTGTGGAC GGCTTCCGGA TCGACACCAT GAAACACGTC 
AATGACGAAT TCTGGCAGGA GTTCGGGCCC AAGGTCCTTG AATACGCCAA GGAACAGGGC 
AAGGACGAGT TCTTTATGTT CGGCGAGGTC TTTGACACCT CCAAGAGCTT CACCTCGCAG 
TTCACCACCC GCAACAAGAT GCAGGCCGTG CTGGACTTCC CGTTCCAGGA CGCAGCGCGG 
AACTTTGCCT CCCGGAGCCA GTCCGCCAGC CAGCTGGAGA CGTTCTTCGC CGGGGACGAC 
TGGTACACGG ATGCCGACTC CAACGTCTAC GAACTCCCCA CCTTCCTGGG CAACCACGAC 
ATGGGCCGGA TCGGCAGCTT CATTGCCGCG GACAACCCCG GTGCGGACGA CGCCGAACGC 
GTTGCCCGGG ACCGGCTGGC CCACGAGCTG ATGTACTTCT CGCGCGGCAA CCCGGTGGTG 
TACTACGGCG ACGAACAGGG CTTTACGGGC CCCGGCGGGG ACCAGGATGC ACGCCAGACG 
CTCTTCGCCA GCCAGGTGCC CGAATACCTG GACGATGACC TGCTGGGCAC CGACGCCACG 
CATGCCACGG ACAACTTCAA CACCGGCCAC CCGCTGTACA GCAAGATCAG CGAACTCGCA 
GCGCTGACCG CTGAGCACCC GGCACTGCGC AACGGCGCCC ACCAGAACCG GTACGCCGCG 
CAGGGCCAGG GAATCTATGC GTTCTCCCGC ACTGACGCGA AGGACCAGCG CGAGTATGTC 
GTGGCGGTGA ACAACAGCGG CACCGCGCAG ACTGCCGCGG TGCCCACCTA TATCGCCAAG 
CGCAACTACA GCCGGATCTA CGGCGACGCC GGCGGTTCTG CTGCCGAGTC CAAGACTGCC 
GACGACGGCA AGCTCACCGT TACCGTCCCG CCGCTTTCCG CGGTGGTCTA CGAATCGTCA 
GGGCGGATCC CCCGCTCCAA GGCGGCTCCC GCCGTCGGCC TCCAGGAGCC GGCCACGGCG 
GAAGGCGACA ACGGCAGGAT CCGGGTGGCG GCCGACGTCG ACGGTTCCTC GTTCTACGAG 
GTCACCTTCC AGGCGCGCAC AGCAGGCGGG GAATGGGAGC CGATCGGCAC GGACGACACC 
GCCCCGTACC AGGTCTTCCA TGACGTAACG GGACTGAACC CGGGCACCGC CGTGGAATAC 
CGCGCGGCGG TCCTGGACAA CGGCGGACAC ACCTCGGTCA GCGCGGCCCG CACGGGCACG 
GTCCCCTCCC CGGTCCTCGC CATGCAGAAG CCGGCAGAGG GCAGCAGCGT GGACGGCAAG 
GTGGAAGTCA GCGCCACGGC CAGCCCGGAG AAAGCTGACT ACACGGTCAG CTTCGAACGC 
AGCGTGGACG GCGGCGGGTG GGCTCCGATC GGGTCGGACA GTTCCTCGCC GGTGTACACC 
GTTTTCGATG ATCTCGCGGC GCTGGCACTC GCCGACGGCA CACAGCTCCG CTACCGGGCA 
ACCATGTCCG TCCCGGGCGC GGAGAACGTA GTCAGCGACA TCCGGACCGT GGTGGCCGGT 
GAGATCCCGC AGCCGGACTC CGTGACCGTG GCGGGCAGCC TGAACTCCGA GATGGGCTGT 
CCGGACGACT GGCAGCCTGC GTGCCTAAAG GCCTTCATGG CACTTGACCC GGCGGACCAG 
GTCTGGCGCC TGACCGTGCC GGAACTGCCG GCGGGAACGT ATGAGTTCAA GGCCGCGCTC 
AACGGCAAGT GGGACGAGAA CTACGGCGCC GGCGGCGCGT TCGACGGCGG CAACATCGTG 
CTGGAGCACC CGGGCGGGGC CGTGACGTTC CGCTACGACC ACACCACGCA TGTGCTGAGC 
CCCGTTTACG CCTCACAGCA GCCCGGAGCC GTGGCCGCGG CAGGGAGCAT GAACCTGGAA 
CAGGGGTGCC CGGAAGACTG GATGCCCGGC TGCGACCAGG CCCAGTTGGT GCTGGACCCC 
GCCGACCTGG TGTGGAAGCT GTCAGTGCCG GCCCTTCCGC CCGGCAACTA TGAGTTCAAG 
GCCGCGCTGA ACCGGTCCTG GACCGAGAGC TACGGCGCCG GCGGTTCGCC TAACGGTGCC 
AACATCAGCC TGGCGCACGA CGGCGGCCCG CTCACCATCC GGTACGACCA CTTCACGCAT 
GTGATGACTG CCGGATAG

Protein sequence

MVAALVAAAA LAAPAQAAPE PKGPGAPSAS HSLRAPVTDE NFYFVMADRF SNGSSANDDG 
GLGSDPMVSG YDPTKKGFYN GGDLKGLLDK IDYIQGLGTT SIWLTPSFKN KAVQPEDKSA 
GYHGYWVTDF TQIDPHLGTN AELKALIDEA HSRGMKVYFD IITNHTADVI GYKEGARTAY 
KSKDVAPYKT ADGEVFDDRD YAGTDTFPEL DPATSFPYTP VLDEAEKDLK VPGWLNNPAL 
YHNRGDTTFQ GEDSFYGDFF GLDDLFTENP EVVDGMTKVY EDWIKDFGVD GFRIDTMKHV 
NDEFWQEFGP KVLEYAKEQG KDEFFMFGEV FDTSKSFTSQ FTTRNKMQAV LDFPFQDAAR 
NFASRSQSAS QLETFFAGDD WYTDADSNVY ELPTFLGNHD MGRIGSFIAA DNPGADDAER 
VARDRLAHEL MYFSRGNPVV YYGDEQGFTG PGGDQDARQT LFASQVPEYL DDDLLGTDAT 
HATDNFNTGH PLYSKISELA ALTAEHPALR NGAHQNRYAA QGQGIYAFSR TDAKDQREYV 
VAVNNSGTAQ TAAVPTYIAK RNYSRIYGDA GGSAAESKTA DDGKLTVTVP PLSAVVYESS 
GRIPRSKAAP AVGLQEPATA EGDNGRIRVA ADVDGSSFYE VTFQARTAGG EWEPIGTDDT 
APYQVFHDVT GLNPGTAVEY RAAVLDNGGH TSVSAARTGT VPSPVLAMQK PAEGSSVDGK 
VEVSATASPE KADYTVSFER SVDGGGWAPI GSDSSSPVYT VFDDLAALAL ADGTQLRYRA 
TMSVPGAENV VSDIRTVVAG EIPQPDSVTV AGSLNSEMGC PDDWQPACLK AFMALDPADQ 
VWRLTVPELP AGTYEFKAAL NGKWDENYGA GGAFDGGNIV LEHPGGAVTF RYDHTTHVLS 
PVYASQQPGA VAAAGSMNLE QGCPEDWMPG CDQAQLVLDP ADLVWKLSVP ALPPGNYEFK 
AALNRSWTES YGAGGSPNGA NISLAHDGGP LTIRYDHFTH VMTAG