Gene GM21_0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0114
Symbol
ID	8135417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	138830
End bp	141274
Gene Length	2445 bp
Protein Length	814 aa
Translation table	11
GC content	62%
IMG OID	644867734
Product	glycoside hydrolase family 57
Protein accession	YP_003019958
Protein GI	253698769
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1449] Alpha-amylase/alpha-mannosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	0.0789579
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGCAAG CTAAAGAGAG GTTCGTCTGC ATTCACGGCC ATTTCTACCA GCCGCCGCGC 
GAGAACCCGT GGCTTGAGGC GGTCGAGATC CAGGATTCCG CCTTCCCCTA CCACGACTGG 
AACGAGCGGA TCACGGCAGA GTGCTACGCC GCAAACTCCG CGTCCCGCAT ACTCGACGGC 
GACCAGCGGG TCATGGATAT CACCAGCAAC TACGCCAAGA TCAACTTCAA TTTCGGCCCA 
ACGGTACTCT CCTGGATGGC CTTCGCCGCT CCGAAAATCT ACCAGGCGAT CCTGGACGCG 
GACAAGCTGA GCATGAAGTG GCGCTCCGGG CACGGTTCGG CCATCGCCCA GGTCTTCAAC 
CACATGATCA TGCCGCTGGC CAACTCCAGG GACAAGCGGA CCCAGATCGT CTGGGGGATC 
AAGGACTTCG AGCAGAGGTT CCAGCGCTTC CCGGAAGGGA TGTGGCTTGC GGAGACCGCA 
GTGGACCTGG AGAGCCTGGA CCTCCTGGCC GAGTATGGGA TCAAGTACAC CATCCTCGCC 
CCGCACCAGG CTGCGGGGTA CCGCGAGCTG GGCGCCGAGG AGTGGACCGA GACGGAGATC 
GATCCCACCA GGGCCTACCT TTGCAGGCTT CCCTCCGGGC GCGAGATCAG CCTCTTTTTT 
TACGACGGCC CCATATCCCG CGCGGTCGCC TTCGAAAATC TCCTGGACAG CGGCGAGGCG 
TTAGCGAACC GGCTGGTGGG AGGATTCACC GAGGACCGCG ACTGGGAACA GCTCATGCAC 
ATCGCCACCG ACGGCGAGAC CTACGGCCAC CACCAGAAAT TCGGCGACAT GGCGCTCGCC 
GCCGCGCTGA ACCACATCGA GCAGAACAAC CTGGCGCGGC TCACCAACTA CGGCGAATAC 
CTGGAGCTTT GCCCCCCGAC CATGGAGGCG AAGATCCACG AGCGGACCTC CTGGAGCTGC 
GCCCATGGCG TTGAGCGCTG GAACAGCGAC TGCGGCTGCT CGGGCGGAAC GCCTGGATGG 
AACCAGCAGT GGCGCGGCCC CTTGCGAGCC TCTCTCGACT GGCTGCGGGA CCGCCTGGCT 
CAGGGGTTCT CCAGAAAGGG GGCGGAGCTT TTGAAGGACC CGTGGCAGGC TAGGGATGCC 
TACATCGAGG TGATCCTGAA CCGGGAAATG GAGCAGGCCG AAAGCTTCCT GGCCCAGCAC 
GCGAAGAAGG ATCTCGACGC CGACGAGAAA ATAGCCGCGC TGAAGCTCCT GGAGATGCAG 
CGCCACGCCA TGCTGATGTA CACGAGCTGC GGCTGGTTCT TCGACGAACT CTCGGGGCTG 
GAGACGGTGC AGGTGATCGA TTACGCCAGC CGCGCGTTGC AGCTTTCCGA TGGCATCGTG 
GAACACGGCG TGGAGAAGGC ATTTCTGGAT CGTCTCAAGG AGGCGAAGAG CAACATCCCC 
GCGCACCAGG ACGGCCTTTG GATCTACCAG AACTTCGTGC TCCCCATCCG GCTGGACCTG 
GTCAAGGTCG GCGCCCACTA CGCCTTCAGT TCGCTCTACG AGGAGTACGA GGACCATTCC 
CAGATCTACT GCTACGCCAT AGCGAAAGAG GAGTACGGCA AGATCTCCAC CCCGGACGCG 
GTGATAGCCA TGGGGCGCAT CCACGTCGCC AGCGAGATCA CCGAGGAGAA CACCTGCCTC 
ACCTTCTGCG TCATGCGCCT GGGGAGCCAC GACTTCAAGG GGGGGGTGAT CGAAAGCTGC 
GACGGGGAGG CGTATGCGGC CATGCGGGAG GAGATGAGCG CCAGCTTCGA CAAAGGGCTC 
TACACCGAGC TGGTCACCCT GATGGACAAG CACTTCGGCA CCCACAGCTT CTCGCTTTTG 
AACCTCTTCT CCGACGAGCA GCGCAAGATC ATCAACATCA TCATCAACCA GAACATGGAG 
GAGAGCATCT CCAGCTACCA GGATATGTTC GAGCGCAGCC GTCCGCTGAT GGAGTTCGTC 
AAGGATACCC GGGTCCCGGT GCCGCACATA TTCCTGGCCG CGGCCGAGCC TGCTCTGAAC 
CAGGCGCTGA AAAAGGCGAT GAGCGAGGAG GAGATCGACG AGGACGCGGT GCGCCGCATC 
ATCGGGCAGA TCAAGAAGTG GCAGGTGGGG ATCGACGGCG GTGACACCGA GTACTTCATG 
CGGCGGCACA TGGAGAGCAT GTCGGCGCAA CTGATGGAGG ACCCGGGTGA CGCGAAGCTC 
ATGGGGAGGA TGCTGAAGTA CATGAACCTC CTGAACGAGA TCCCCATCAA CCTGGTGCTC 
TGGCAGATGC AGAACGACTA CTACATCCTG GCCAAGACCG TCTACCCCGA TTACGCCGCA 
AAGGCGGCCA AGGGGGAGGA GGGGGCGGCC GCATGGACCG AGGCGTTCCA GAAGCTGGGG 
GAGACCTTCC GCTTCAATCT CGGCGCAGTG CTGCCGCAGG GGTAG

Protein sequence

MEQAKERFVC IHGHFYQPPR ENPWLEAVEI QDSAFPYHDW NERITAECYA ANSASRILDG 
DQRVMDITSN YAKINFNFGP TVLSWMAFAA PKIYQAILDA DKLSMKWRSG HGSAIAQVFN 
HMIMPLANSR DKRTQIVWGI KDFEQRFQRF PEGMWLAETA VDLESLDLLA EYGIKYTILA 
PHQAAGYREL GAEEWTETEI DPTRAYLCRL PSGREISLFF YDGPISRAVA FENLLDSGEA 
LANRLVGGFT EDRDWEQLMH IATDGETYGH HQKFGDMALA AALNHIEQNN LARLTNYGEY 
LELCPPTMEA KIHERTSWSC AHGVERWNSD CGCSGGTPGW NQQWRGPLRA SLDWLRDRLA 
QGFSRKGAEL LKDPWQARDA YIEVILNREM EQAESFLAQH AKKDLDADEK IAALKLLEMQ 
RHAMLMYTSC GWFFDELSGL ETVQVIDYAS RALQLSDGIV EHGVEKAFLD RLKEAKSNIP 
AHQDGLWIYQ NFVLPIRLDL VKVGAHYAFS SLYEEYEDHS QIYCYAIAKE EYGKISTPDA 
VIAMGRIHVA SEITEENTCL TFCVMRLGSH DFKGGVIESC DGEAYAAMRE EMSASFDKGL 
YTELVTLMDK HFGTHSFSLL NLFSDEQRKI INIIINQNME ESISSYQDMF ERSRPLMEFV 
KDTRVPVPHI FLAAAEPALN QALKKAMSEE EIDEDAVRRI IGQIKKWQVG IDGGDTEYFM 
RRHMESMSAQ LMEDPGDAKL MGRMLKYMNL LNEIPINLVL WQMQNDYYIL AKTVYPDYAA 
KAAKGEEGAA AWTEAFQKLG ETFRFNLGAV LPQG