Gene GM21_0898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0898
Symbol
ID	8136219
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	1072033
End bp	1074087
Gene Length	2055 bp
Protein Length	684 aa
Translation table	11
GC content	64%
IMG OID	644868514
Product	Organic solvent tolerance protein
Protein accession	YP_003020723
Protein GI	253699534
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1452] Organic solvent tolerance protein OstA
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	6.33463e-30
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAAGCTG CAAGAGCCGC CTGGCTTCTC ACATACCTTC TGCTGTCGGC GGTACCCGCC 
CAGGGCGAAC CCGCGGTCCC CGTCGATAAA GAGATCACCC TGAAAGCGGA CGACCTCTCG 
GTGGACGTTC CGACTCAGAG CTACCGTGCC CAGGGCGAGG TCCAAATCAC CCAGGACGGC 
CTCTCCCTTC TGGCCGACAG CGTGGTCTAT CGCCGGCTCA CCGGCGAGGC CCAGGCGCAG 
GGGGGCGTAC TCCTTGAGCG CAGCGGCGAC ACCATGAAGG GGGACAGCCT CTCTTTGAAC 
CTGCTCTCCC AGACAGGGGA ACTCCTAAAC GGCGAGCTTT TCGTCAAGAG GTCGAACTTC 
CGGTTGCGCG CCGAGCGCCT GGAGAAGACC GGCCCCGCCG ACTACAAGAT GACCAAGGGA 
ACCTTCACCA CCTGCGACGG CGACAAGCCC AGCTGGAGGT TCGAGGCGAG GCAGGTGAAG 
GTGACCCTGG AGGAGTTCGC CACGGCCAAA GACGCCGTCT TCTACGTCGG CGACGTCCCC 
ATCTTCTATA CCCCGTACCT CATCTTCCCC GCCAACATCG AACGGCAGTC GGGATTGCTG 
CTCCCGAGGC TCGGTTACTC TTCCAAGAAG GGGTTCTACT ACGACCAGCC TTACTACTGG 
GCCATCAATC CGAGCCAGGA GGCGACCTTC AACCTCAACC TGGAAAGCTC CCGGGGAGTC 
GGGGGCGGTG TGGACTACCG CTACCTGCGT CCGCACGGCA GCTCAGGGAG GCTGCAGACC 
TTCGGCATCT ACGACACCCA GAAGTCGGAG TTCCGCGGCG AGGTGGACCA GCGGCACCTG 
GAGCTTCTCA CCCCCAGGCT CACCCTCGCC TCCAATATCC ATCTCATCAC CGACCGCCGC 
TATTTCCTGG ATTACGGCGA GCTCTCCGGC GAGTACAACC GGCAGTACCT GGAGTCGACG 
CTCTCCTTCG ACCAGCGCTG GGAGCGCAGC AGCCTGTTCG GCGAGCTGCG CTACACCGAC 
GACCTGGAGG CCCCCAACAA CGACGCCACC TTGCAGCGGC TCCCCACGCT CGGTTTCATC 
GCCGCGGGCG AGAAGGTGGG GCCCGCTTTC TTCTCCATGG ATAGCCGCTT CACCAACTTC 
CAGCGGGAGG CTGGAGCCAC CGGGCAGCGC CTGCAGCTGC ATCCCCGGCT CGCCTGGTAC 
GGCAAACCCG CCGGCATTTT GGACCTTTCC CTTTACGGCG GTTACCAGCA GCGTATGTAC 
AGCGCCAAGG GGGAGATCGG CGAGAGTGGT TGGCGGCAAC TGGGGCAGGC GGACGCAGGG 
GGCGCGCTCT CTTTGCCGCT GGAGCGCGTG TACGACGGCC GGCTGCGGCA TCTGATGATC 
CCGGCGGTCG AGTACAGCTT CGTACAGCAA CGGCGCGACG AAGACCTCCC GTTTTTCGAT 
TACGACGACC GCGTGCTGGG GCAAAATGCC GTCCGCTGGT CGCTCAGCAA CGTGGTGACC 
CGGAAGTTCG CCGAAGCGGA CGGAATACCC GAGTACCGTG ACCTCCTCTA CCTGAAGCTC 
TCCCAGGGGT ACTGGCTTTC GGGGCAGCGC CGCGACCTTC TCACCCTGGT GGACGAGGGG 
CACCGGCTCA CGGACCTGAT GCTGGAGGGT GTGCTCACCC CGGTGCAACG GCTCTCCGTG 
GCGCTGGACA CACGCTACAA CACGACCGAC AGCAGGTTTT CCACCGCGAA CGTCGGGGTG 
GAGCTGAAGG GAGAGGGGCG CGACAAGGCG AAACTCGGCT ACCGCCACAG CCGCGGGGAA 
ATCGACTACG TCGAGGGGGG CTTCACCTTC CCGATTACCA AGGACGTCAC CGCCGATCTG 
CTGGGGCGCT ATTCCGCCGA CAGGGGGGAG TTCCTGGAAT CCCGCTACGC GGTCGAGTAC 
CGGCGCCAGT GCTGGAGCGT CATCTTCACC TACTCCGACC GGGTCGGCAG CCGCAACGTA 
GCAGGCGAGC AGCAGTTCAG CGTCAACTTC TCGCTGGCGG GGCTCGGTTC GCTGGGGCAG 
TTGCGGGCGT TTTAA

Protein sequence

MKAARAAWLL TYLLLSAVPA QGEPAVPVDK EITLKADDLS VDVPTQSYRA QGEVQITQDG 
LSLLADSVVY RRLTGEAQAQ GGVLLERSGD TMKGDSLSLN LLSQTGELLN GELFVKRSNF 
RLRAERLEKT GPADYKMTKG TFTTCDGDKP SWRFEARQVK VTLEEFATAK DAVFYVGDVP 
IFYTPYLIFP ANIERQSGLL LPRLGYSSKK GFYYDQPYYW AINPSQEATF NLNLESSRGV 
GGGVDYRYLR PHGSSGRLQT FGIYDTQKSE FRGEVDQRHL ELLTPRLTLA SNIHLITDRR 
YFLDYGELSG EYNRQYLEST LSFDQRWERS SLFGELRYTD DLEAPNNDAT LQRLPTLGFI 
AAGEKVGPAF FSMDSRFTNF QREAGATGQR LQLHPRLAWY GKPAGILDLS LYGGYQQRMY 
SAKGEIGESG WRQLGQADAG GALSLPLERV YDGRLRHLMI PAVEYSFVQQ RRDEDLPFFD 
YDDRVLGQNA VRWSLSNVVT RKFAEADGIP EYRDLLYLKL SQGYWLSGQR RDLLTLVDEG 
HRLTDLMLEG VLTPVQRLSV ALDTRYNTTD SRFSTANVGV ELKGEGRDKA KLGYRHSRGE 
IDYVEGGFTF PITKDVTADL LGRYSADRGE FLESRYAVEY RRQCWSVIFT YSDRVGSRNV 
AGEQQFSVNF SLAGLGSLGQ LRAF