Gene Arth_2907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Arth_2907
Symbol
ID	4444429
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Arthrobacter sp. FB24
Kingdom	Bacteria
Replicon accession	NC_008541
Strand	-
Start bp	3274031
End bp	3275785
Gene Length	1755 bp
Protein Length	584 aa
Translation table	11
GC content	68%
IMG OID	639690730
Product	malto-oligosyltrehalose trehalohydrolase
Protein accession	YP_832386
Protein GI	116671453
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0296] 1,4-alpha-glucan branching enzyme
TIGRFAM ID	[TIGR02402] malto-oligosyltrehalose trehalohydrolase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.172907
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCACC CCGCAAGCGG AAGCGGACGC TTCGACATCT GGGCCCCGGA GGTCACTGCC 
ATCACGTTGT TGGCCGACGG CTCTGAATAC CCCATGAGCC AGCGCGGCGA CGGCTGGTGG 
ACGGCCTCGG ACGCCCCGGC CGGGGGAGAG GTGGACTACG GCTACCTGCC GGGGACGGAC 
ACCACCCCCT TGCCGGATCC CCGGTCCCGC CGCCAGCCGG CCGGCGTGCA CTCTCTGTCC 
CGCACCTTCG ACCCCGCCGC CCACGCGTGG GCCGACGGGA ACTGGGCGGG CCGGGAGCTG 
CAGGGTGCCG TCATCTACGA ACTGCACATT GGCACGTTCA CGCCGGAGGG CACCCTGGAA 
GCCGCAGCCG GAAAGCTGGG CTACCTCAAG GACCTCGGCG TCGACTTCGT GGAACTCCTG 
CCCGTCAACG GCTTCAACGG CACCCACAAC TGGGGCTACG ACGGGGTCCT CTGGTACACC 
GTCCATGAGG GCTACGGCGG CCCTGCCGCT TACCAGCGTT TCGTGGACGC CGCCCACGGC 
GCAGGCCTGG GCGTCATCCA GGACGTCGTG TACAACCACC TCGGTCCCAG CGGAAACTAT 
CTGCCGAAGT TCGGGCCCTA CTTGAAGTCC GGCGAAGGGA ACACCTGGGG CGACTCGGTG 
AACCTGGACG GCAACGGATC AGACGAGGTC CGCCGCTACA TCCTGGACAA CGCAGCCATG 
TGGCTCAGGG ACTACCACGT CGACGGGCTG CGGATCGACG CCGTGCACGC CTTCAAGGAC 
GAGCGGGCGG TCCACCTCCT GGAGGAGTTC GGTGCCCTGG GCGACACTGT GGCCGCGGAA 
ACCGGCCGCC CGATCACCAT GATCGCGGAG TCGGACCTCA ACAACCCCCG CCTGCTGTAC 
CCCCGCGACG TCAACGGGTA CGGACTGGAG GGCCAGTGGA GCGACGACTT CCACCACGCC 
GTCCACGTGA ACATCAGCGG CGAGACGGAG GGGTACTACA GCGACTTCGA TTCGCTGGGC 
GCCCTGGCCA AGGTGCTGCG CGACGGGTTC TTCCACGACG GCAGCTACTC CAGCTTCCGC 
GGCCGGCACC ACGGGCGGCC CATTAACACC GGGCTGGTGC ACCCCGCAGC CCTGGTGGTG 
TGCAGCCAGA ACCACGACCA GATCGGCAAC CGCGCCACCG GCGACAGGCT TTCCCAGTCG 
CTGTCCTACG GCCGGTTGGC CGTGGCGGCC GTCCTCACGC TGACGTCCCC GTTCACGCCC 
ATGCTCTTTA TGGGGGAGGA ATACGGCGCC ACCACGCCGT GGCAGTTCTT CACCTCCCAC 
CCCGAGCCGG AGCTGGGCAA GGCGACGGCG GAAGGCCGTA TCAAGGAGTT CGAACGCATG 
GGGTGGGATC CCGCCGTCGT ACCTGATCCC CAGGATCCGG AGACCTTCAA CCGTTCGAAA 
CTGAACTGGG CCGAGGCCAC CGAGGGTGAC CATGCCCGCC TCCTGGACCT CTACCGGACC 
CTGACGGCGC TCCGCCGTTC CACCCCGGAA CTTGCGGGGC TGGGCTTCAC GGACACCGCG 
GTGGACTACA GCGAAGAGGA GGGGTGGCTG CGGTTCCGGC GTGGAGACGT GCTGGTGGCG 
CTGAACTTCT CCGAACAGAC GGTAAAGCTC GAAGATGCGG CCGGATCAGT GTTGCTTTCC 
ACCGACGAGG CATCAGTGCC CGACGGCGGC TCGCTCTTGC TGGCGCCGTG GAGTGCCGTC 
ATCGTGAGGG CCTGA

Protein sequence

MTHPASGSGR FDIWAPEVTA ITLLADGSEY PMSQRGDGWW TASDAPAGGE VDYGYLPGTD 
TTPLPDPRSR RQPAGVHSLS RTFDPAAHAW ADGNWAGREL QGAVIYELHI GTFTPEGTLE 
AAAGKLGYLK DLGVDFVELL PVNGFNGTHN WGYDGVLWYT VHEGYGGPAA YQRFVDAAHG 
AGLGVIQDVV YNHLGPSGNY LPKFGPYLKS GEGNTWGDSV NLDGNGSDEV RRYILDNAAM 
WLRDYHVDGL RIDAVHAFKD ERAVHLLEEF GALGDTVAAE TGRPITMIAE SDLNNPRLLY 
PRDVNGYGLE GQWSDDFHHA VHVNISGETE GYYSDFDSLG ALAKVLRDGF FHDGSYSSFR 
GRHHGRPINT GLVHPAALVV CSQNHDQIGN RATGDRLSQS LSYGRLAVAA VLTLTSPFTP 
MLFMGEEYGA TTPWQFFTSH PEPELGKATA EGRIKEFERM GWDPAVVPDP QDPETFNRSK 
LNWAEATEGD HARLLDLYRT LTALRRSTPE LAGLGFTDTA VDYSEEEGWL RFRRGDVLVA 
LNFSEQTVKL EDAAGSVLLS TDEASVPDGG SLLLAPWSAV IVRA