Gene GM21_3707 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_3707
Symbol
ID	8139081
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	4272421
End bp	4273566
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	62%
IMG OID	644871327
Product	DEAD/DEAH box helicase domain protein
Protein accession	YP_003023485
Protein GI	253702296
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCATTTG CATCCCTTGG ACTGCACCCG GAGCTGTTGA GCGCGATCGC GGAACAGCCG 
GAATTCAAGC GTCCCTACCC CATCCAGAGC GAGGTCATTC CCGCCGTTTT AAAGGGAAGG 
GATCTGATCG CCATCGCCAA GACCGGTTCC GGCAAGACGG CGAGCTTCAT CCTGCCGCTC 
CTGCAACTCA TCCACGGCCA GGATGCGGGG GAGCGGCGCA GGCTCAGGGC CTTGGTCCTG 
GTGCCGACGC GCGAGCTCGC CGCCCAGATC GAGGAGGTCG CTAAACAGCT CGGGAGCCAT 
CTGGAGCCTC GTGTCAAGAC CGGCGCGGTC TTCGGCGGGG TCGCCATCAA CCCGCAGATG 
ATCCAACTGA AAGGGATCGA GCTGCTCATC GCCACTCCCG GCCGCCTGCT TGAACTCGTG 
GCCAAAAACA GCGTGAAGCT TTCCTCGGTC GCCACCTTAG TCCTTGACGA AGCCGACCGG 
CTCTACGCGG AAGACTTTCA GGACGAAATG CAGCAGATCC TCGCCCTGCT CCCGGCAAAA 
CGGCAGAATT TGCTCTTTTC AGCGACCATT CCCCCGGAAG TGGAGCGGTT GGCGGCGAGC 
CTGCTGAGCG ATCCGATGCG GATCGAAATC GAGGCCAAGG CGTCCGAAAC GGAGCTGATT 
TCCCAGCAGA TTTACCTGGT GGACTCAAGC CGCAAGGGCC CCCTGCTCAG GTATCTGATC 
AAAAGCGGCG ATTGGAAACA GGTGTTGGTC TTCACTTCGT CGCAGAAGCG GGCCGACAAC 
GTCACCAGGA AGCTCGTCGC CAACGGGATC AGCGCCTCCA CATTTCACAG CGGCATGAGC 
CAAGGTGGAA GGACCGCCGC CCTGGCCAAG TTCAAGACGG GTGAACTGCG GGTGCTGGTG 
GCAACCGACC TCGCCTCCCG CGGGATAGAC GTGCAGTCTC TTCCACATGT GGTCAATTAC 
GAACTTCCCC GGTCGCCCAT CGACTACCAG CACCGCATAG GGAGAACCGG CAGGGCCGAA 
ACCGCCGGGG TGGCCGTGAC GCTGCTCTGC CCGGAAGATC TGGCGCACTT CAAGGTGATC 
GAGAAACGGC TCGGGCAACG ACTGGCACGT ATCGACACTG CCGAGCTCGA TCTCTCCGCT 
TACTAG

Protein sequence

MSFASLGLHP ELLSAIAEQP EFKRPYPIQS EVIPAVLKGR DLIAIAKTGS GKTASFILPL 
LQLIHGQDAG ERRRLRALVL VPTRELAAQI EEVAKQLGSH LEPRVKTGAV FGGVAINPQM 
IQLKGIELLI ATPGRLLELV AKNSVKLSSV ATLVLDEADR LYAEDFQDEM QQILALLPAK 
RQNLLFSATI PPEVERLAAS LLSDPMRIEI EAKASETELI SQQIYLVDSS RKGPLLRYLI 
KSGDWKQVLV FTSSQKRADN VTRKLVANGI SASTFHSGMS QGGRTAALAK FKTGELRVLV 
ATDLASRGID VQSLPHVVNY ELPRSPIDYQ HRIGRTGRAE TAGVAVTLLC PEDLAHFKVI 
EKRLGQRLAR IDTAELDLSA Y