Gene GM21_0065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GM21_0065
Symbol
ID	8135364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter sp. M21
Kingdom	Bacteria
Replicon accession	NC_012918
Strand	-
Start bp	81700
End bp	82704
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	64%
IMG OID	644867682
Product	thiamine biosynthesis protein
Protein accession	YP_003019910
Protein GI	253698721
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0482] Predicted tRNA(5-methylaminomethyl-2-thiouridylate) methyltransferase, contains the PP-loop ATPase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	1.96842e-23
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCAGAGAA AAGCCATAGC CCTTCTGTCG GGCGGACTCG ATTCCACCCT CGCGGTCAAG 
GTCCTCCTCG ACCAGGGGAT CGCCGTCGAG GCCCTCAACT TCACCTCCCC TTTTTGCACC 
TGCACCGGGA AAAACGCCGG CTGCAAGTCG GAGGCGGTCC GCGTGGCGGA AGATTTCAAG 
ATCCCCATCA AGGTGATGCA CAAGGGGGCG GACTACCTCG AGGTGGTCAG AAACCCCAAG 
CACGGCCACG GCAAGGGGAT GAACCCCTGC ATCGACTGCC GCATCTTCCT TCTCAAAAAG 
GCCAAGGAGT ACATGCTGGA ATCCGGCGCC GATTTCGTCT TCACCGGGGA GGTCCTGGGA 
CAGCGCCCCA TGAGCCAGCG CCGCGACACC CTGCGCATCA TCGAGAAGGA GAGCGGCCTT 
GAGGGGCTCC TTTTGCGCCC CCTCTCGGCT AAGCACTTCC AGCCCACCAT CCCGGAGCAG 
GAAGGGTGGG TCGACCGCGA GAAGCTCCTC TCCATCCAGG GGAGGTCCCG GAAGGAGCAG 
TTCGAGCTCG CGGCCGAGTT GGACGTGAAG AACTACCCCT GCCCCGCCGG CGGCTGCCTT 
TTGACCGAGC TCTCCTTCGT CGGCAAGATT CGCGACGTCT TCGACCACTC GGACGAACTC 
AACATGAGGG ACTTCCGGCT CCTCAAGCTC GGGCGGCATT TCAGGATCGG ACCCCGGACC 
AAGGTTATCC TCGGCCGCAA CGAGGGGGAG AACGAACTCC TGGAGCGGGC CGTCCAGCCC 
GGGGAGGCAA CGCTTCGCTG GGTCGAGGGA ATGAGCCCGC TCGCCGCGGT CATGGGGGAA 
ACCACCGATC ACCTTTTGGA AAAGGCGGGG CAGATACTTT TGCGCTACAC CAAGGCGGAG 
CCGGGCTCCC CGGCCACCCT GAGCGTTTTG CGCGACGGCG GCGAAACGGA GCTTAAGACG 
GTGAACGCTC TCGACGAGGC GGCCGTGGAG GCGCTCAGGC TCTAG

Protein sequence

MQRKAIALLS GGLDSTLAVK VLLDQGIAVE ALNFTSPFCT CTGKNAGCKS EAVRVAEDFK 
IPIKVMHKGA DYLEVVRNPK HGHGKGMNPC IDCRIFLLKK AKEYMLESGA DFVFTGEVLG 
QRPMSQRRDT LRIIEKESGL EGLLLRPLSA KHFQPTIPEQ EGWVDREKLL SIQGRSRKEQ 
FELAAELDVK NYPCPAGGCL LTELSFVGKI RDVFDHSDEL NMRDFRLLKL GRHFRIGPRT 
KVILGRNEGE NELLERAVQP GEATLRWVEG MSPLAAVMGE TTDHLLEKAG QILLRYTKAE 
PGSPATLSVL RDGGETELKT VNALDEAAVE ALRL