Gene GM21_0113 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0113
Symbol
ID	8135416
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	136954
End bp	138843
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	63%
IMG OID	644867733
Product	malto-oligosyltrehalose trehalohydrolase
Protein accession	YP_003019957
Protein GI	253698768
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0296] 1,4-alpha-glucan branching enzyme
TIGRFAM ID	[TIGR02402] malto-oligosyltrehalose trehalohydrolase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	0.0767542
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAGCTG CTGCCTGGAA ATTCGACTTG GGGGCCACCG TGCTCAAAGA GGGAGGAACC 
CGCTTCCGGG TCTGGGCCCC GAAGTCGCAG ACGGTGAACC TCCTCATCCT TTCCGGCAAG 
GCGGCCGGCG CGGTCCCCAT GCAGCAGGAG GAAATGGGGT ACTACTCCGC CACCGTTGCC 
GGGGTGGCGG ACGGCGACCG CTATCTTTAC CAGCTCGACA ACGGCAAGAC CTTCCCCGAT 
CCCGTTTCGC GCTACCAGCC GGACGGGGTG CACGAGCCGT CCCAGGTGGT GGACCCCGAT 
CTGTTCGAAT GGGGGGACGA TGGGTGGACC GGCATCCCGC TGGAGCAGTA CCGGATCTAC 
GAGATCCACG TGGGGACCTT CACCAAGGAG GGGACCTTCG AGGCGGCCAT TCCTTTTCTC 
GACTACCTGG TGGAGTTGGG GATCACCGCG GTCGAGATCA TGCCGGTGTC GCAGTGCCCC 
GGCAAGCGCA ACTGGGGTTA CGACGGCGTC TTTCACTTCG CGCCCCAGAG CAGCTTCGGC 
GGCCCGGACG GATTGAAAAG GCTGGTGAAC GCCTGCCACA GGAAGGGGCT CGCTGTGCTC 
CTGGACGTGG TCTACAACCA CTTCGGCCCC GAGGGGAATT ACCTCTGGGA TTTCGGACAC 
TACTTCACCG ACAAGTACCG CACCCCGTGG GGACGGGCCA TGAACCTGGA CGGGGCCTAC 
AGCGACTCGG TCCTCGAGTT CTTCTTTTTG AACGCGGGGT ACTGGATCAA CGAGTTCCGC 
TTCGATGGGC TGCGGCTGGA CGCGGTGGAC TGGATCTTCG ATCAGACACC GAAGCCGCTT 
TTGCAGCGGC TGGCCGAGGA GGTGCACCTG CACCGGGGAC GGCTGGGGAG GGAGATCTTC 
CTGTTCGCTG AGAACGACAC CAACGACGCG CGGCTGATCA AGCCGCCGCA GCAGTGCGGT 
TTCGGCCTGG ACGCCCAGTG GTGCGACAAC TTCCACCATG CGCTGCGCAC CCTGCTCACC 
AGGGAAACCA CAGGCTATTA CGAGGACTTC GGTCAGTTCA GCCAGATGGT GAAGACATAC 
GAGGAGGCTT TCGTCTTCAC CGGCGAGTAT TCCCACTACC GCAAGCGCCG CCAGGGTGGA 
CCGGCGAAGG ACCGCCCCAC CTCGCAGTTC GTGGTCTTCT CGCAGAACCA CGACCAGGTG 
GGAAACAGAA AATGCGGGGA CCGGCTGAGC GGGAGCCTCC CGGTGGGACA GCTCCTTCTG 
GTGGCCGGGG TGGTAATCCT TTCTCCCTAC ATCCCGCTGC TGTTCATGGG GGAGGAGTAC 
GGGGAGAAAG CCCCTTTCCA CTATTTCATC GACCACAGCG ATCCGGAACT GGTCGAGCTG 
GTCAGGAAGG GGAAGCACGA GGAACACGCC TCGGGGGTAT GTGAGGGGGA GATCCCCGAC 
CCGGCGGCGG AGGAGACCTT CCTGGAGTCG AAGATAGATC TCGTCGGCGA AAAGGTGGGG 
GAACAGGCGG TAATCCTTGA GTTCTACAGG AAGCTCTTCT CCCTGCGCAG CACCCTTCCC 
GCGCTCCAGG TGTTCCAGCG CGAGCAGATG GAGGTCTCGG GGTTGCCTCG GCAAAAGGTC 
CTTTGTTTCA GAAGGTGGTC CGGCGGGAAC TCGGTCCTTT GCCTCTTCAG CTTCAACAAT 
ATGCAGCAGG AGATCCCCCT GCGGCTTTCG GAAGGGAAGT GGGAGAAGCT GCTCGACTCG 
TCGGCCAAGC AGTGGCTCGG GCCGGGGGAA GAGGCGCCGG GGAAGGTCGA GGTCACAGGA 
GAGCCGGGGG AGATTCCGGT ATCGATCAAC CCATACAGCG TGGTGGTGTA CGCCGCGGAT 
CTGACAGGAG GAGCACATGG AGCAAGCTAA

Protein sequence

MVAAAWKFDL GATVLKEGGT RFRVWAPKSQ TVNLLILSGK AAGAVPMQQE EMGYYSATVA 
GVADGDRYLY QLDNGKTFPD PVSRYQPDGV HEPSQVVDPD LFEWGDDGWT GIPLEQYRIY 
EIHVGTFTKE GTFEAAIPFL DYLVELGITA VEIMPVSQCP GKRNWGYDGV FHFAPQSSFG 
GPDGLKRLVN ACHRKGLAVL LDVVYNHFGP EGNYLWDFGH YFTDKYRTPW GRAMNLDGAY 
SDSVLEFFFL NAGYWINEFR FDGLRLDAVD WIFDQTPKPL LQRLAEEVHL HRGRLGREIF 
LFAENDTNDA RLIKPPQQCG FGLDAQWCDN FHHALRTLLT RETTGYYEDF GQFSQMVKTY 
EEAFVFTGEY SHYRKRRQGG PAKDRPTSQF VVFSQNHDQV GNRKCGDRLS GSLPVGQLLL 
VAGVVILSPY IPLLFMGEEY GEKAPFHYFI DHSDPELVEL VRKGKHEEHA SGVCEGEIPD 
PAAEETFLES KIDLVGEKVG EQAVILEFYR KLFSLRSTLP ALQVFQREQM EVSGLPRQKV 
LCFRRWSGGN SVLCLFSFNN MQQEIPLRLS EGKWEKLLDS SAKQWLGPGE EAPGKVEVTG 
EPGEIPVSIN PYSVVVYAAD LTGGAHGAS