Gene M446_1913 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1913
Symbol
ID	6134520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	2137687
End bp	2138796
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	64%
IMG OID	641642152
Product	glucose sorbosone dehydrogenase
Protein accession	YP_001768820
Protein GI	170740165
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2133] Glucose/sorbosone dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGATCTA TCCTTCTCGC CACTGCCACG CTCGTGGTGA CTTCCCTCCC TGTTGCGGGT 
CAACCAGCGC AGCGCCTCAG AACAGAGAAG GCCGAGATCA TCGTCGAAAC CGTCGCGGGC 
GGTCTCAACC ATCCCTGGGG TCTCGCCTTC CTGCCGGATG GACGCATGTT GGTCACCGAA 
AAGCCGGGGC GCCTGCGCAT CGTCTCGGCC GAAGGGGAGA TCTCACCTCC GATCGCCAAG 
ACGCCGCAGC CGTCCATTCA GTTTTTGGAC GTAGCACTCG ATCCCAATTT CTCTGAGAAC 
CAGCTCGTTT ACCTTACGTA TGTCGAGCCG CGTGGGGGCG GCTTGGCCAC GGCGGCAGGA 
CGTGGGCGGC TCAGCACGAC CGGTACGACT TTGGAGGGCT TCGAGGTCAT CTTTCGGCAG 
CAGCCGGCCT CGCCGATCGA GGATCACTTC GGATCGCGCC TCGCCTTCAC GCCCGACAGC 
AAGCTCTTCA TCTCGACAGG AGACCGTGAC GAGCCTGACT CGGCTCAGGA TCTCTCCACC 
CACATGGGCA AGCTCGTCCG CGTCAACCGG GACGGCTCCG TGCCGGCCGA CAACCCATTC 
GTGCATCGTG CAGGAGTTCG GCCAGAGATC TGGTCCTACG GCCATCGAAA CATCGAGGGC 
CTCGCCGTCC AGCCGGGTAC AGGCGTCCTC TGGGCGGGGG AGTTCGGGCC GACCGGCGGA 
GATGAAATCA ACATTCCCAA GCCGGGCGGC AACTACGGTT GGCCCTTAGT GAGCTGGGGT 
GATCACACGG ATGGGCGCGT GATCCCGCGG CCGCCGACCC GGCCTGACCT GACGGACGCC 
ATTTATCACT GGACACCATC GGTCTCGTTC TCTGGGATGA CGTTCTACAC GGGGGCTGCG 
TTTCCGGCCT GGCATGGAAA CCTGCTGCTG GCTGGACTGG CTTCACAGGC CTTGATCCGT 
CTGACGCTCG CCGGGGCACG TGTCACTGGG GAGGAGCGCA TCCCGATGGA CGCACGCATC 
CGGCATGTTG CCCAAGGACG GGATGGCCTT CTCTACCTTC TGACCGACGA GGACCAGGGG 
CGGATCCTAC GTTTCAAGCC GGGCGGCTAA

Protein sequence

MRSILLATAT LVVTSLPVAG QPAQRLRTEK AEIIVETVAG GLNHPWGLAF LPDGRMLVTE 
KPGRLRIVSA EGEISPPIAK TPQPSIQFLD VALDPNFSEN QLVYLTYVEP RGGGLATAAG 
RGRLSTTGTT LEGFEVIFRQ QPASPIEDHF GSRLAFTPDS KLFISTGDRD EPDSAQDLST 
HMGKLVRVNR DGSVPADNPF VHRAGVRPEI WSYGHRNIEG LAVQPGTGVL WAGEFGPTGG 
DEINIPKPGG NYGWPLVSWG DHTDGRVIPR PPTRPDLTDA IYHWTPSVSF SGMTFYTGAA 
FPAWHGNLLL AGLASQALIR LTLAGARVTG EERIPMDARI RHVAQGRDGL LYLLTDEDQG 
RILRFKPGG