Gene GM21_2007 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2007
Symbol
ID	8137341
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2327119
End bp	2328444
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	62%
IMG OID	644869620
Product	heat shock protein DnaJ domain protein
Protein accession	YP_003021817
Protein GI	253700628
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	2.8484999999999997e-22
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACAGCTC GTTTTAAGGG AAAACACCCG GAAGAGATCG AACTCGAGCA AAAACGCGCC 
GAGCTGGCGT CGTTGCGCGC CCGGCACGCG GAGCTTACGG CGGAGCTGCA GCAACTGCGC 
GAGGAGATCG CCGGTTTCGA GAAAAATTAC CAGGCGACTC TTGGGCTGCG CATGGCGGAA 
CTGGAGCGCC TGGAGGCGGA GATAGCGCGC CTCAACGGCG GCGGCGCTGA TAACGACCCG 
GAGATCCAGG AGGAGTACCT GGACCGAGAA ACCTACAGCC GCGGCAAATC TTTCAAGTCG 
GCTGCCGGCG CCGGATCGCG CGGCAGGGTG TGGAAAGCTG AAGAAGAGGA CATCAAGGCG 
CTATACCGGG AGGTCGCCAA GGCGATCCAC CCGGACCTTG CCGGGGAGGG CGCCGGCAGC 
TTAAGGCACG AACTGATGTT GAAGGCGAAC CAGGCGTACG CGGATGAGGA TTCCCGTGCT 
TTGAGGGAGA TACTGCGCAG TTGGAGAAGG CATCATCCGG AGCGGCAGCC TGAGGCGCCG 
GATACCAAGG TGGAACTGGC GCGGGTGAAA AGGGAGATAG CGGTGGAGGC GCAGGCGGTG 
CATGACCTGA GCGATCAGGT GGAGCAACTC AGGACGAGCT ACGTCTGCTG CTTTAAACTG 
CGGGTCGACC AGAGCCTGGC GGAAGGGAGC GATCTATTCG CCGAGATGAT AGCTGCGGCG 
GACATGAATG TCGCCAGGGC GCAGCGCCGG CTGGCTGCCC TGAGAAGCGA GAAGGCGCGG 
GAGGCTGAGG GACGCACCAG GGTGAGAAGA AGTATCCAGT TCCCCGAAGG TCTTTCTTGC 
GGAACTCTCT ACTTCCGGGA TCTTGCCTCG GCGGACTTCA GCCAGTGGAA GAAGGCGGGG 
CCTGCGGTGG GAAGGGTGGA GGTGTACATC GACCAGGCCG TGCGCCTGGA CGTGAAGGAG 
CAGGCGGGAC CGGACCTCAA GCTTTTGCAG CAATTGAGAC CAAACGACCT TCAGGCGCTC 
TTTCTCTACG AGATGACCGA CGCGAACCTC GACAACATCG TGCACCTGAG CGGCCTGGAG 
GAGCTTTACC TCTGTGGCCA GGGGTTGACC GACGCTGCGC TTCTTTGCAT CTCCTCGCTC 
ACCAACCTGA AGAGGATCTA CTTGTACCAG ACCGCCATCT CGGACCGGGG GCTCGTTTAC 
CTCCAGGGGC TGCAGGGGCT GAAGGGGCTC ACCAGCAGCG GCAACAGCAT CACCGAGGAG 
GGGCTCGCGA TATTCCAGAA AGCCATCCCC GGCGTCAAGA CGGTAAGTTT CAAGTGGAGA 
CGGTGA

Protein sequence

MTARFKGKHP EEIELEQKRA ELASLRARHA ELTAELQQLR EEIAGFEKNY QATLGLRMAE 
LERLEAEIAR LNGGGADNDP EIQEEYLDRE TYSRGKSFKS AAGAGSRGRV WKAEEEDIKA 
LYREVAKAIH PDLAGEGAGS LRHELMLKAN QAYADEDSRA LREILRSWRR HHPERQPEAP 
DTKVELARVK REIAVEAQAV HDLSDQVEQL RTSYVCCFKL RVDQSLAEGS DLFAEMIAAA 
DMNVARAQRR LAALRSEKAR EAEGRTRVRR SIQFPEGLSC GTLYFRDLAS ADFSQWKKAG 
PAVGRVEVYI DQAVRLDVKE QAGPDLKLLQ QLRPNDLQAL FLYEMTDANL DNIVHLSGLE 
ELYLCGQGLT DAALLCISSL TNLKRIYLYQ TAISDRGLVY LQGLQGLKGL TSSGNSITEE 
GLAIFQKAIP GVKTVSFKWR R