Gene Moth_1093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1093
Symbol
ID	3833059
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	1121295
End bp	1122392
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	63%
IMG OID	637829021
Product	cobalamin (vitamin B12) biosynthesis CbiG protein
Protein accession	YP_429950
Protein GI	83589941
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG2073] Cobalamin biosynthesis protein CbiG
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTAGGG AAAAGAGGCT GGCCATTGTA GCCCTTACCC GGCCGGGGCT GCAAACAGCC 
CTGCGCCTGG CTGGTAGCCT GCCCGAAGGG ACCCCGGTTT TTGCCCCGGC CAGCCTGGCC 
GCGGGTGGCG CCGAAACGGA TGGGGAAATA AGGGTTGATT TTTATTCCGG CGGGTTACCA 
GATTTCCTGG GGGAGATTTT TCACCGGTAC CGGGGCTTGA TCCTGATCAT GGCTGCCGGT 
ATTGCCGTCC GGGCGTTGCG TACCCACATG GTATCCAAGT TGACCGACCC GGCTGTTGTA 
GTAGTTGATG CTGCTGGTAA ATATGCTATC AGCCTGCTCT CCGGCCACCT TGGGGGTGCC 
AACGAGCTGG CCCGCCGGGT GGCCGCCATC CTGGGAGGAG AGGCGGTGAT TACCACGGCC 
AGCGAAAGCC GGGGCCTCCC GGCCCTGGAC CTGGTTGCCC GGCGCCTGGA AATGACTATC 
TGGCCCCGAG ACAATATGAC AATGGTGATG GCCGCCCTGG TGAATGGTGA AGCTATTGAC 
CTGCTGGTGG AACCTCCCTT GCTGGCACGC CTGCAAGGCG AACTCCCGGA CTTGGGAGCC 
CGCCCGCTGG AGGGGTACTC CGGGGTCAGG GGTGAGGGGG CCGGAATTAT GGTCACCTGG 
CGGCGACTGC CTCTGCCCGG ACCGCGCTGG GTTTACTGGC GGCCGCGGGT CATAGTCGCT 
GGCGTTGGTT GCCGCCGGGG CGTACCTGCT GGCACCATTC TCTATGCCCT GGGGGTGGCC 
TTGAAAAGGG CCGGTATCAG CCGCCAGAGC CTGCGATCAC TGGCCAGTGT GGATTTCAAG 
GCCCGGGAGC CTGGCCTTGA GCTGGCGGCC CGGCAGCTGG GGTTGGAGTT ACGTACCTTT 
CCACCGGATG AACTAGCCGC CTGCCTGGAA AGACACCCGG AACTGTCCCG TTCCCAAACT 
GTAGCTGCCA GGGTGGGTTT AACCGGAGTA TGCGAGCCAG CGGCCGTGCT GGCAGGAGGA 
GATGGTGAAT TATTATGGCC CAAAATAAAA TGCCGGGGGG TAACCATCGC CTTGGCCCGG 
GTTCAAGGGG CGAAATAG

Protein sequence

MAREKRLAIV ALTRPGLQTA LRLAGSLPEG TPVFAPASLA AGGAETDGEI RVDFYSGGLP 
DFLGEIFHRY RGLILIMAAG IAVRALRTHM VSKLTDPAVV VVDAAGKYAI SLLSGHLGGA 
NELARRVAAI LGGEAVITTA SESRGLPALD LVARRLEMTI WPRDNMTMVM AALVNGEAID 
LLVEPPLLAR LQGELPDLGA RPLEGYSGVR GEGAGIMVTW RRLPLPGPRW VYWRPRVIVA 
GVGCRRGVPA GTILYALGVA LKRAGISRQS LRSLASVDFK AREPGLELAA RQLGLELRTF 
PPDELAACLE RHPELSRSQT VAARVGLTGV CEPAAVLAGG DGELLWPKIK CRGVTIALAR 
VQGAK