Gene Acid345_0241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_0241
Symbol
ID	4073091
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	+
Start bp	252526
End bp	254271
Gene Length	1746 bp
Protein Length	581 aa
Translation table	11
GC content	59%
IMG OID	637982242
Product	malto-oligosyltrehalose trehalohydrolase
Protein accession	YP_589320
Protein GI	94967272
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0296] 1,4-alpha-glucan branching enzyme
TIGRFAM ID	[TIGR02402] malto-oligosyltrehalose trehalohydrolase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAAAACCT CCGCCTCGCA ACTTCAATAC GGTGCCAGCC TGCGCGATGG TCGCGTGCAT 
TTCCGCGTCT GGGCGCCGAA CGCCAAAAGT CTCTCCATTC GATTGATCCA GGGTAGTTCG 
CAGAACGATC AGCCGATGCA GCGTGACGAT CGCGGCGAGT GGACGCTCGA GGCCGATGCG 
CACGCGGGCG ACCGCTACTT TTGCGTGATC AATGGCGAGC AGGCTGTGCC AGATCCGGTC 
TCGCGCTTCC AGCCCGAAGG CGTGCATGGG CCGACCGAGA TCGTCGATCC TTCGCAGTTC 
CAGTGGTCCG ATGAAAACTG GGAAGGCGTT GACTACGACG ACTACGTGAT CTACGAGCTA 
CACGTAGGGA CATTCACGCC GGAAGGCACG CTGGATGCGG CTATCGAGAA GCTGCCGTAT 
CTGAAGGCGC TCGGTATCAC GGTCGTTGAA CTAATGCCGG TGAATGCGTT TCCCGGCAAG 
CATAACTGGG GCTACGACGG CGTCGGCCTC TACGCGGTGC AGGAGAGCTA TGGCGGCCCC 
GAGGCACTAC GCCGCTTTGT GGATGCCGCT CACGCGCACG GGCTCGCGGT GATTCTCGAC 
GTGGTCTACA ACCACCTCGG CAACGAGGGC AATTACCTGC GGATGTTCGG GCCATATTTT 
ACCGACCACC ATAAAACACC GTGGGGCGAG GCCATCAATT ACGACACAAC GCCCGGCTGT 
GAGCATGTCC GCCGGTTCGT GATTGATAAC GCGCTCTACT GGATACGTGA GTATCACCTC 
GACGGCCTGC GTCTCGATGC CGTGCAGACG ATCAAAGACG ATTCGTCGAA GCACGTGCTG 
CAAGAACTCC AGGAAAATGT GCAGACACTC GCCGCCGAAC TCGGCCGCAA GGTCTGCGTA 
ATTGCCGAGA CCGATGAGAA TATTTCCAAA TACGTGCGTC CTTTCGGCAG CGGTTACGGA 
CTGCAAGGCT TCTGGAGTGA TGACTTCCAC CACGCCATCC ACGCGTACTT CACCGGCGAG 
CGCCAAGGCT ATTACCAGGA CTTCGGCGAC CCAGAGCAGA TCGTCACTGC GATCCGCGAC 
GGTTATGCAT TTCAAGGCCA GCCCTTCAAG TTCTGGAAGG GCACGAAGCG TGGCGAGTTG 
CCGGTGAATG TGCAATTGCC ACGCAACGTG ATCTGCACGC AGAACCACGA CCAGGTCGGC 
AATCGCGCCA AGGGCGAGCG CTTAACGACG CTCGTGCCTC GTGGCGCACG TTATGTTTCG 
GCGGCGCTGC TGTTGCTTGC GCCGCACACG CCGCTGCTTT TCATGGGGCA GGAATACGAC 
GAAGAGCATC CGTTTCAGTT CTTCACCGAC TACGGCGATC CCGTGCTGCA GAACGCCGTG 
AGCGAAGGCC GCCGCAAGGA ATTCGAGGAT TTCGATTTCC GGGAAGTGCC CGATCCGCAG 
GATCCCGAAA CGTTCAACCG CAGCCGCCTC GATTGGTCAA AGGCCGTGGA TACGAACCCG 
ATGCTGCGGT GGTATCGCGA GCTGCTGCGG CTGCGCAAAC GTTATGTCAC GTCTGGCGAG 
CGCACTGCCT ATGCAACTTA TCAAGATGGC GTGATCACGA TGATGGCGCC GGGCGACACG 
CCGGACCTGA TCCTCTTCGC TACGCTCGAA CCTGGGCGTC AACTTCCGGC CGAAGAAGAC 
GGCTGGAACC TGACTTTGAA GTACAAGAGC GAGGATGGCT ACCAGGTTCG GATCTTCACG 
CGTTGA

Protein sequence

MKTSASQLQY GASLRDGRVH FRVWAPNAKS LSIRLIQGSS QNDQPMQRDD RGEWTLEADA 
HAGDRYFCVI NGEQAVPDPV SRFQPEGVHG PTEIVDPSQF QWSDENWEGV DYDDYVIYEL 
HVGTFTPEGT LDAAIEKLPY LKALGITVVE LMPVNAFPGK HNWGYDGVGL YAVQESYGGP 
EALRRFVDAA HAHGLAVILD VVYNHLGNEG NYLRMFGPYF TDHHKTPWGE AINYDTTPGC 
EHVRRFVIDN ALYWIREYHL DGLRLDAVQT IKDDSSKHVL QELQENVQTL AAELGRKVCV 
IAETDENISK YVRPFGSGYG LQGFWSDDFH HAIHAYFTGE RQGYYQDFGD PEQIVTAIRD 
GYAFQGQPFK FWKGTKRGEL PVNVQLPRNV ICTQNHDQVG NRAKGERLTT LVPRGARYVS 
AALLLLAPHT PLLFMGQEYD EEHPFQFFTD YGDPVLQNAV SEGRRKEFED FDFREVPDPQ 
DPETFNRSRL DWSKAVDTNP MLRWYRELLR LRKRYVTSGE RTAYATYQDG VITMMAPGDT 
PDLILFATLE PGRQLPAEED GWNLTLKYKS EDGYQVRIFT R