Gene Mnod_6003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_6003
Symbol
ID	7305363
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	6108129
End bp	6109259
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	77%
IMG OID	643603626
Product	protein of unknown function DUF201
Protein accession	YP_002501133
Protein GI	220925831
COG category	[R] General function prediction only
COG ID	[COG2232] Predicted ATP-dependent carboligase related to biotin carboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.866607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCGCGCG ACGGCGATGC GATCCTGATC GCCGCGCAAT CCGGGCGGGC CCTCGCGGCG 
GCGGCGCGGC GGGCGGGCCT GCGCCCCTTC GTGGCCGACC TGTTCGGGGA CGAGGACATG 
CGGGCGCTCG CCGCCGGCTA CCGGGCGCTG CCGGGCCGCT TCGGCGCCGG ACCGGCCGCG 
CGGGGCGTGA TCGCGGCCCT CGATGCGCTC GCCGCCGAGG CGGGCACGCC TCTCGGGGTG 
GTGCTCGGCA GCGGCTTCGA GAGGGCACCC GCCCTGATGC GGGCCATCGC GGCGCGCCAC 
CGCCTGATCG GCGCCGCCCC CGCCACCGTC GCGGCCCTCA AGGACCCGGC GAACCTCGCC 
GCCCTGTGCG CGCGCCTCGG CATCCCGCAC CCGCCGCTCA GCCTCGAGGC CGTGCCCGAT 
CCGGAGAACT GGCTGCTCAA GCGCCGCGGC GCCTCGGGGG GCGGCCATAT CCGGCCGGCG 
GGGCCGGGCC CCGTGGCCCG GGGCGCCTAT CTGCAGCGCC GGATGCCCGG CACCGCACGG 
TCCCTGACAA TCCTCGCCGA CGGGCGCCGG ATCCTCGTTA TCGCCGACAC GGCCCAATGG 
ACCGCCCCGA GCCCGGCGCG GCCCTTCCGC TACGCCGGCG CCGTCGAGCC CGGCGGCATG 
CCGCCGGGCG TGCGGGAGGC CGCGACGGCG GCCGTCGCCG CCCTGGTGGA GGAAACGGGG 
CTCTGCGGCC TCGCCAGCGC CGATTTCCTG GTCGACGGCA CCGACTGGTG GCTCCTCGAG 
ATCAATCCGC GTCCCGGCGC CACCCTGGAC GTGCTCGACC GCCGCACCGA ACCGCTCCTC 
GCCCGCCACA TCGACGCAGC CGGCGGCCGG CTCGGCGCCA CCCTGGCCCT TCCTCCAGAT 
GCGGTCGCCA CGCAGATCTG CTACGCCGTT GAGCGCATTC CGCTAGTGCC GCCCCTGGCT 
TGGCCGGACT TCGTGATGGA CCGGCCGCTT GCCGGCAGCC GGATCCCCGC CGGGGCGCCG 
ATCTGCACGG TGCGGGCCTC GGGGCCCGAC GCGCAGGCCG CCCGAAGCGA GGTCCGAGCC 
CGAGCCGAGG CCGTGCGGGC CTTAATTCAC CGCGAGGGAG ACCGTCCATG A

Protein sequence

MARDGDAILI AAQSGRALAA AARRAGLRPF VADLFGDEDM RALAAGYRAL PGRFGAGPAA 
RGVIAALDAL AAEAGTPLGV VLGSGFERAP ALMRAIAARH RLIGAAPATV AALKDPANLA 
ALCARLGIPH PPLSLEAVPD PENWLLKRRG ASGGGHIRPA GPGPVARGAY LQRRMPGTAR 
SLTILADGRR ILVIADTAQW TAPSPARPFR YAGAVEPGGM PPGVREAATA AVAALVEETG 
LCGLASADFL VDGTDWWLLE INPRPGATLD VLDRRTEPLL ARHIDAAGGR LGATLALPPD 
AVATQICYAV ERIPLVPPLA WPDFVMDRPL AGSRIPAGAP ICTVRASGPD AQAARSEVRA 
RAEAVRALIH REGDRP