Gene GM21_2730 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2730
Symbol
ID	8138073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	3178405
End bp	3179616
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	64%
IMG OID	644870335
Product	hypothetical protein
Protein accession	YP_003022524
Protein GI	253701335
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	118
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGC CTAGCCGAGA ACTACTGACG AAACTGCTGC ACGCCTGGCA GGGGAACCCG 
AAAGGGGCGA GGAAGGTGTC CCTTTCTATC ACCAAGGCGC GCGCCGCCGC CTACTTCCAG 
GCAGTTCTCC CCGAAGAAAA GGGTGCGCTG CACGCCGGCC TTGAGGAAGC AGCGGCGTCG 
GGGGCCATCG CCTTGGAGTG GGGAAAAGGC TTCGAAAGTC ACATCCTCAG GCGGGTCGTC 
TTGGTTGATG GAGCAGTGCT GGCCGAGTAC CTCGGCGTGC CGCTGGCGTC GCAGCAGGCC 
GACCAGGCCC GGTCGGCGCT GGAGAGTTGC CTGGAAGAAC GAGAAAGCTG GATTGACCGC 
TGGGTGGCAG AGCTATTGGA TCACTGGAGC CGGAACCAGG GGTTCAACGG CATCGCACCC 
GGAGAGGTCG CCACGGCCAC CCTCCTGGTC AGGGCTCTTT CGGCAGTGGC CGCCGGACGG 
CAGCGCAACC TCGACCTGAG AACCTTCAGC ACCCGCGAAT TGGGAAACTC GAAGGCGATG 
GAGTCGATCC TGGCGAAGTT CGCCTCGATC TGGAAGAAGC ATCACGCAGC CGACTATCCC 
GCGGAGTTGA CCAACGAAGA ACTCTTCGAG GCTATCGGGC TCGTTAAATT TCCCCAGCCG 
CTGCTGTTGC GCGGTCCCCT TACACTCAGG CTTGCCGGTC GCGACGTCGA TTGCGAGGGG 
ATCGAGCCGT TCGTGGGGCT TCCGCCCCAA GCCATGCTGG ACGTCCTGGC CGACCAGCGA 
CCGGAGTACT GCCTGACCAT TGAAAACCTC GCCAGCTTCA ACCGCTACAC GACGGAGGTC 
CGCGACCGTG GGGTGATCGT CTTCACGTCC GGCTTCCCGT CGCCGGGCGT CGCGGATTTC 
CTGCGCCTGC TCGACCGGGC TCTGCCGGCG GCAATCCCTT TCTTCCACTG GGGAGACATC 
GACGAGGGAG GATTGAAGAT TTTCTTGTAC CTGCAGGGGC TGGTAAAGAG GGGGGTGCAG 
CCGCACCGGA TGACCCCGGA ACTCCTGACG GCGAAGGGGC AGCCTTCGCC CGGATTGCGG 
CGGCGGGAAG TGGGGCGGCT GATCGCCGAT GACAGGACTG TAGCCCTCCT CGCCGAGGCG 
ATCCTCTCAA CGGCCCCTGC CAGAATTCTG GAACAGGAGA ACATAGACCC GGTCGCTCCT 
TCCGTGGCCT GA

Protein sequence

MNQPSRELLT KLLHAWQGNP KGARKVSLSI TKARAAAYFQ AVLPEEKGAL HAGLEEAAAS 
GAIALEWGKG FESHILRRVV LVDGAVLAEY LGVPLASQQA DQARSALESC LEERESWIDR 
WVAELLDHWS RNQGFNGIAP GEVATATLLV RALSAVAAGR QRNLDLRTFS TRELGNSKAM 
ESILAKFASI WKKHHAADYP AELTNEELFE AIGLVKFPQP LLLRGPLTLR LAGRDVDCEG 
IEPFVGLPPQ AMLDVLADQR PEYCLTIENL ASFNRYTTEV RDRGVIVFTS GFPSPGVADF 
LRLLDRALPA AIPFFHWGDI DEGGLKIFLY LQGLVKRGVQ PHRMTPELLT AKGQPSPGLR 
RREVGRLIAD DRTVALLAEA ILSTAPARIL EQENIDPVAP SVA