Gene GM21_2049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_2049
Symbol
ID	8137385
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	+
Start bp	2371782
End bp	2373116
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	63%
IMG OID	644869664
Product	pyridine nucleotide-disulphide oxidoreductase dimerisation region
Protein accession	YP_003021859
Protein GI	253700670
COG category	[R] General function prediction only
COG ID	[COG0446] Uncharacterized NAD(FAD)-dependent dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	5.49451e-22
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGACTG TGATCATCGG CGGGGTCGCG GCAGGACTGT CGGCGGCAAG CCAGGCAAAG 
CGGCTGTCCC CCGAATCGGA AGTGGTAGTG CTGGAGAAAA CCGGCGACGT ATCCTATGCC 
GCGTGCGGGA TGCCTTACAA CCTTTTCTTC AAGGAGAAGC CGGTCGAAAA GCTCTACGCG 
CTGTCGCTTG AGACCATTCG CAAGGAGCGT GGAATAGACT ATAGGCTGCG GCAGGAGGTC 
ACCGGCATCG ACCCGGTCGG CAAGGTGGTG AGCGTGACGG ATCTCGCCAC AGGCAAGAGC 
TACGAAGAGC GCTACGACTT CCTGGTCTAC GCCACCGGCA ACAGCGCCAT CAGGCTCACC 
GCACCCGGCT TCGACGACGG CGACGTCTTT TGTTTCAAGA CGCTCGACGA CACCCGCCAC 
GTCAAGCAGT TCATCTACGA CAAGGCGCCG AAGCGGGCGG TCTTGGTCGG CGCCGGCTAC 
ACCAACCTGG AGGTCGCCGA CGTACTCACC AACATGAAGA TCAAGCCGGT CATCCTGGAG 
AAAGCCCCCA CCATACTCCC TTCCTTCTGC GAGGAGGCGA GGGAGAAGGT AATGGAGAAG 
GTGAAGGAGA GGGGGGTCGA GCTTATAACC GGTGTCGATA TCGCCGAGAA GGCGGGGGGC 
GAGGTCCGGT CCTCGGCAGG CGTTTTCCCC GCCGACCTCG TGGTGGTCGC CGTCGGCACC 
CGCCCCAACA CCGCCCTTTT CGCCGCTGCT GGAGGCGAAT TGGGGACGGC GGGGGCGGCC 
AAGGTCGACC GTTACCTGCG CACCAATCTC GACTCCGTCT TCGCCGGGGG GGACTGCGCC 
GAGCATTATG TCCGGCAACT GGGAATGAAC TCCTACTTCC CGCTTGGCCC TGCGGCCAAC 
AAGCACGGGC GCGTCATAGG GAGCAACGTC TCCAACCCCG ACCATATGAT GGAATTCTGG 
GGAATCGATC AGACCGCGGT CTTCAAGTTC TTCGAGCTGA GCGTCGCCAC CACCGGTCTG 
AACGAGAGGC AACTGCTCGC GCTCGGCAAG GATTTCGTCA AGGTCGCCGT GGACAACCCC 
ACCCGCGGCG AATTCCCCGG TGGAAGCACC ATGCGCGTGA TCCTTTTCTG CCAGAAGGGG 
GACGGGCTTC TCCTCGGCGC GCAGATCGTC GGCGAGGACG TGGTGGCCAA GAGGCTCGAC 
GTGCTGGCGA CGGCGATCTA CAAGCAGATG ACAGTCTTCG AGATCGCCGA ACTGGATCTC 
GCCTACGCCC CTCCCTACTC GCCGGTATGG GACCCGATCC TCGTCGCCGC CAACGTCGCC 
GTCAAGAAGG TCTAA

Protein sequence

MKTVIIGGVA AGLSAASQAK RLSPESEVVV LEKTGDVSYA ACGMPYNLFF KEKPVEKLYA 
LSLETIRKER GIDYRLRQEV TGIDPVGKVV SVTDLATGKS YEERYDFLVY ATGNSAIRLT 
APGFDDGDVF CFKTLDDTRH VKQFIYDKAP KRAVLVGAGY TNLEVADVLT NMKIKPVILE 
KAPTILPSFC EEAREKVMEK VKERGVELIT GVDIAEKAGG EVRSSAGVFP ADLVVVAVGT 
RPNTALFAAA GGELGTAGAA KVDRYLRTNL DSVFAGGDCA EHYVRQLGMN SYFPLGPAAN 
KHGRVIGSNV SNPDHMMEFW GIDQTAVFKF FELSVATTGL NERQLLALGK DFVKVAVDNP 
TRGEFPGGST MRVILFCQKG DGLLLGAQIV GEDVVAKRLD VLATAIYKQM TVFEIAELDL 
AYAPPYSPVW DPILVAANVA VKKV