Gene Arth_0743 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_0743
Symbol
ID	4446748
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	800116
End bp	801837
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	67%
IMG OID	639688548
Product	alpha amylase, catalytic region
Protein accession	YP_830241
Protein GI	116669308
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.802881
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTCAAAG CCCCCGCCGT CGCGGCAGGG CCGCTGACCC TGGTCCACAC TGCTGATGAA 
GCTTCCGGCT GGTGGCGGTC CGCCGTCATC TACCAGGTCT ATCCGCGCTC CTTTCGGGAC 
CTGAACGGAG ACGGCATCGG CGATCTTGCC GGCATAACAG CGGAGCTGCC CCAGTTGGCC 
CGGCTCGATG TGGATGCCGT CTGGCTGTCG CCGTTCTACC GCTCACCGCA AAAGGACGCC 
GGCTATGACG TCAGCGACTA CTGTGACGTC GATCCGCTGT TCGGCACCCT GGCTGACTTC 
GACGCCATGA TGGTGGAGGC AACCCGCCTG AAGCTGCGGG TGATCGTGGA CCTCGTTCCC 
AATCACTGCT CGGACCAGCA CGCCGCTTTC CAGGCTGCCC TCGCCGCCCC CGCCGGCAGT 
GCGGAACGTG ACATGTATAT CTTCCGGGAC GGCCTGGGAA CCTATGGTGA AGAGCCTCCC 
AACAACTGGC AGTCGCACTT TGGCGGACCC GCCTGGACAC GAATCACGGA GCCGGACGGC 
CGGCCCGGGC AGTGGTACCT CCACCTCTTC GACACCTCCC AGCCCGACTT CAACTGGGAC 
AACCAGGCAG TCCACGATGA GTTCGAGCGG GTGCTGCGTT TCTGGCTGGA CCGGGGCGTG 
TCCGGATTCC GCGTGGATGT GGCCCACGCA CTGGTGAAGG CTCCCGGCCT GCCGGAGTGG 
GGCGGCCGGG CCGACGGCAA CAGCTGCGAC GGCTACCCCG GCCATGACGC ACCCATGTTC 
GGCCAGCCGG CCCTGCATGA CATCTACCGG GCCTGGCGCC GTATCCTGGC CGAGTACGGT 
CCGGACCGCA TCCTGTGTGC CGAAGCCAAT GTGGACCCGC TGCCCCGTTT GGCCGACTGG 
GTCCGCCCGG ACGAAATGCA CCAGGCGTTC AATTTCCCGT ATCTCCATGC GGGCCTGGAC 
GTCCACCGCC TGCGCGGTGT CATCACTGAC TCCCTGGTGG CGCTGGACGC CGTCGGCGCG 
CCAAGCACAT GGGTACTGTC CAACCACGAC GTCGTCCGCC ACGCCACCCG TTTCGGCTAC 
GACGGCCCTG CCCCGCGCGA CGGCGACGGG ATCGGCACCT TTGACCGGCA GCCCGACCTG 
GCCCTGGGCA GGACCAGGGC TGCCGCCGCC TCCATGTTCA TGCTGGGGCT TCCCGGCGGG 
GCGTACCTCT ACCAGGGTGA AGAACTGGGC CTTCCGGACG GAATCGATAT CCCGGACAGC 
CAGCGCCAGG ACCCCACGTT CGCGCGCACC GGCGGAGAGC GGTTGGGCCG CGACGGCTGC 
CGGGTGCCCC TTCCCTGGCG TGCCGCTGAA CTGCACGCCG GCTTCGGCTC GGGACAGGAT 
CCGTGGCTGC CGCAGCCTGC GAGCTTCAGC GAACTGGCGC GCGACGCGCA GGCCGAAGAG 
CCGACGTCGC ATTTGAACCT CTACCGTCGG ATGCTGTCCA TGCGGAGGGA GCTGGACCTG 
GGCAGAGGCT CGCTGGCTTG GCTGGAAAGC TGGTGCAGCG ATTCGTCCCT GGCCTACGTC 
AACGGCACCA CCCTTGTGGT CATGAACACG GGACGTGAAC CGTTGGAACT CCCGGCCGGC 
CGGGTGCTGC TGCGCAGCTC CGCGGAGTCA GCTGCGACGA ACTCGGGCGG TCATCAGCTA 
GGCTCGGGTG AGACGGCCTG GTTGACCCTT GAGGTTGGGT GA

Protein sequence

MLKAPAVAAG PLTLVHTADE ASGWWRSAVI YQVYPRSFRD LNGDGIGDLA GITAELPQLA 
RLDVDAVWLS PFYRSPQKDA GYDVSDYCDV DPLFGTLADF DAMMVEATRL KLRVIVDLVP 
NHCSDQHAAF QAALAAPAGS AERDMYIFRD GLGTYGEEPP NNWQSHFGGP AWTRITEPDG 
RPGQWYLHLF DTSQPDFNWD NQAVHDEFER VLRFWLDRGV SGFRVDVAHA LVKAPGLPEW 
GGRADGNSCD GYPGHDAPMF GQPALHDIYR AWRRILAEYG PDRILCAEAN VDPLPRLADW 
VRPDEMHQAF NFPYLHAGLD VHRLRGVITD SLVALDAVGA PSTWVLSNHD VVRHATRFGY 
DGPAPRDGDG IGTFDRQPDL ALGRTRAAAA SMFMLGLPGG AYLYQGEELG LPDGIDIPDS 
QRQDPTFART GGERLGRDGC RVPLPWRAAE LHAGFGSGQD PWLPQPASFS ELARDAQAEE 
PTSHLNLYRR MLSMRRELDL GRGSLAWLES WCSDSSLAYV NGTTLVVMNT GREPLELPAG 
RVLLRSSAES AATNSGGHQL GSGETAWLTL EVG