Gene GM21_0495 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0495
Symbol
ID	8135805
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	610535
End bp	611653
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	65%
IMG OID	644868114
Product	protein of unknown function DUF34
Protein accession	YP_003020333
Protein GI	253699144
COG category	[S] Function unknown
COG ID	[COG0327] Uncharacterized conserved protein
TIGRFAM ID	[TIGR00486] dinuclear metal center protein, YbgI/SA1388 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	62
Fosmid unclonability p-value	0.0420348
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCACTC CAAGAGTTTC AGATATATCC GGAATCACTG GCAAAATTGC CCCGACCCAC 
CTCGCCGAGT CCTGGGATAA CGTGGGGCTG CAGCTTGGGG ATCCCTCCTG CCAGGTCTCG 
CGGATCATGG TCGCGCTGGA TCCCGGCCGT CCCGCCATCG AGACGGCCGT CGAGGCCGGT 
TGCCGGCTTC TGATAACGCA CCACCCCTTC ATCTTCACCC CCCTCAAGAA GATCTCCACC 
GCTGATGAAA CCGGACGCCT CGCCATACTC GCCCTGAAAA ACGATCTCTC CATCATCTCG 
CTGCACACAA ACTTCGATAT AGCCCCAGGC GGCGTGAACG ATCTATTGGC CGGGCTGCTC 
GGCGTCCAGG AGGCGCAGCC GCTCAGGATC ACCGGCGGCG ACGAGTACGT GAAGATGGTC 
CTTTTCGCGC CGCGCGGCTG CGAAGAGAAG CTTTTAGGTG CGCTTTCCCC CTTCATGCCT 
CACATCGGCA ACTACCGCGA TTGCTCCTAC CAGGGGGAGG GGACCGGGAG GTTCACGCCG 
CTTCCGGGGG CGCGTCCGTT CGTCGGAGCG GTTGGGGCGA GCCATGCCGA GCCCGAGAGC 
AGGCTGGAGC TCTTGCTGGT CAAGGAACGT ATCGCCGCCG CGGTCGCGGC GCTCAAGGGG 
GCGCATCCCT ACGAGGAGCC TGCCTACGAT CTTTACCCGG TGCTGAACCG TGGCGAGGCG 
TACGGGCTCG GCAGAATCGG AAAGCTGGCG GAGCCGGTGA GCGCCGGCGC CTATGCGCTG 
CTGGTCAAGG AACGGTTGGC GGCGACCGGG GTGCGCCTGG TGGGCGACCC GGCGCGGCAG 
GTGAAGAAGG TGGCCCTTTG CGGCGGCTCC GGCGCGTCGC TCATCCACGA GGCGCAGCGC 
AAGGGGGCCG ATCTTTTGGT CACAGCGGAT GTGAAGTACC ACGAGGCGCG CGAGGCCGAA 
GCGCTGGGCC TGGCGCTTCT TGACGCCGGG CATTTCTCGA CCGAGTACCC CATGGTTCGT 
GGGTTGGCCG GGCAGCTCAG AGCCGCCCTT AAGGCAAAGC GGTTCGAGGC GGAGGTTTTG 
GAGTACCAAG GAGAGCGCGA GCCATTCAGT TTTTGGTAG

Protein sequence

MITPRVSDIS GITGKIAPTH LAESWDNVGL QLGDPSCQVS RIMVALDPGR PAIETAVEAG 
CRLLITHHPF IFTPLKKIST ADETGRLAIL ALKNDLSIIS LHTNFDIAPG GVNDLLAGLL 
GVQEAQPLRI TGGDEYVKMV LFAPRGCEEK LLGALSPFMP HIGNYRDCSY QGEGTGRFTP 
LPGARPFVGA VGASHAEPES RLELLLVKER IAAAVAALKG AHPYEEPAYD LYPVLNRGEA 
YGLGRIGKLA EPVSAGAYAL LVKERLAATG VRLVGDPARQ VKKVALCGGS GASLIHEAQR 
KGADLLVTAD VKYHEAREAE ALGLALLDAG HFSTEYPMVR GLAGQLRAAL KAKRFEAEVL 
EYQGEREPFS FW