Gene Arth_3720 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_3720
Symbol
ID	4443721
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	+
Start bp	4187670
End bp	4189076
Gene Length	1407 bp
Protein Length	468 aa
Translation table	11
GC content	68%
IMG OID	639691544
Product	alpha amylase, catalytic region
Protein accession	YP_833195
Protein GI	116672262
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGGAAC CGGACTGGGT AAAACACGCA ATCTGGTGGC AGGTCTACCC GATCGGCTTT 
GTCGGCGCGG AGCAGGCTGC CGCTGAACGG GCGTCCAAGG CGCCGACGTC CGAGGCGCCG 
GGCCAGACTG TGGCCCATCG GCTGGGGCAG CTGGTTCCCT GGCTTGACTA CGTGCTGGAA 
CTCGGCGCGT CCGGGCTCGC GCTGGGGCCC GTCTTCGCCT CGGAAACCCA CGGCTATGAC 
ACCACGGACT ACTTCAGGAT CGATCCCCGG CTGGGCGATG ACGCGGACTT TGACGAGCTC 
ATCGCCCAGT GCCACGCCCG CGGACTGAAA GTCCTGCTGG ACGGCGTCTT CAACCACGTG 
GGGCGCAGCT TCGGGGCGTT CCAGGGTGTG CTCACGGACG GTCCCGGGTC TCCTGCCGCC 
TCCTGGTTCC GCCTGCGGTG GCCGGAGTCC GGATGGGCGC CGGGGACCGA ACCGGGCTAC 
GAGGATTTTG AGGGCCATCA TCACCTGGTG GCGCTCAACC ACGATGAACC GGCAGTTGCC 
GCCCTGGTCA CGGACGTGAT GAAGCACTGG CTAGGCCGGG GAGCGGACGG CTGGCGGCTG 
GACGCGGCGT ACGCTGTGCC GGCGTCGTTC TGGGCCCCGG TGCTGGCTGA GGTGCGCCGC 
GAGTATCCGG ACTCCTATTT CGTGGGCGAG TACATCCACG GCGACTTCGC CGAGGAGGTG 
GAGCGGAGCA CGCTCGACTC GGTCACGCAG TACGAACTGT GGAAGGCCGT CTGGAGTTCA 
CTCAACGATG CCAACTTCTA CGAACTCGCA TCCGCGCTCG AGCGGCACAA CGGGTTCCTG 
GACACCTTCG TGCCGCTCAC GTTCGTGGGC AACCACGACG TCACCCGCCT GGCCAGCAAG 
CTGACGAACC CGGACCAGCT GGCGCTTGCG CTCACAGTCC TCCTGACCGT GGGCGGGACG 
CCCTGCATCT ACTACGGAGA CGAGCAGGCT TTCCGCGGCG TCAAGGAGGA CCGGGCCGGC 
GGAGATGACG CCGTCCGTCC GGCGTTCCCC GCGGGGCCCG CAGAACTGGC GGAGGACGGC 
TGGTCCGTCT ACCACCTGCA CCAGGAACTG ATCAGCCTCC GACGGCGGCA TGCCTGGCTG 
CACCGGGCCC GCACCACGGT CCTGGCGCTC AGCAACGAAC ACCTCGTTTA CCAGGTCCGC 
GGCGACGGTA AGGCAGCAGC AGGTAGCACA GAGGAGGGCG GCGCAGGCGC CGCGCTGACA 
GTCGCGCTGA ACCTTTCCGG CACGCCGGCG GACCTGCCCG TACCGTCCGG GTCAGGCGGC 
CTCCTGGCCG GGCGGGCCCA CCGGCATCCG GATCGGGATG CCGTGGGCCT GCCCGGTTAC 
GGGTGGGCAG TGCTCGGGAA CAGCTAG

Protein sequence

MTEPDWVKHA IWWQVYPIGF VGAEQAAAER ASKAPTSEAP GQTVAHRLGQ LVPWLDYVLE 
LGASGLALGP VFASETHGYD TTDYFRIDPR LGDDADFDEL IAQCHARGLK VLLDGVFNHV 
GRSFGAFQGV LTDGPGSPAA SWFRLRWPES GWAPGTEPGY EDFEGHHHLV ALNHDEPAVA 
ALVTDVMKHW LGRGADGWRL DAAYAVPASF WAPVLAEVRR EYPDSYFVGE YIHGDFAEEV 
ERSTLDSVTQ YELWKAVWSS LNDANFYELA SALERHNGFL DTFVPLTFVG NHDVTRLASK 
LTNPDQLALA LTVLLTVGGT PCIYYGDEQA FRGVKEDRAG GDDAVRPAFP AGPAELAEDG 
WSVYHLHQEL ISLRRRHAWL HRARTTVLAL SNEHLVYQVR GDGKAAAGST EEGGAGAALT 
VALNLSGTPA DLPVPSGSGG LLAGRAHRHP DRDAVGLPGY GWAVLGNS