Gene M446_2083 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2083
Symbol
ID	6134824
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	2329122
End bp	2330120
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	78%
IMG OID	641642312
Product	short chain dehydrogenase
Protein accession	YP_001768980
Protein GI	170740325
COG category	[R] General function prediction only
COG ID	[COG0300] Short-chain dehydrogenases of various substrate specificities
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.244735
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0182364
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCGC GCCGTCCCAG CGCCGTCGTG ACGGGCGGCA CCGCCGGGGT CGGGCGGGCG 
GTGGCGCTCG CCTTCGCCCG CCGGGGCTAC GACGTCGCCG TGCTGGCCCG CGGCCGGCGC 
GGGATCGACG GCACCCTGGC GGAGCTGCGC CGGGCGGGCG CGCGGGCGCT CGGCTTCCAG 
GCCGACGTGG CGGATGCGGG CGCGGTGCAG CGGGCCGCCG ACGCGGTCGC GGAGGCCTGG 
GCGGGGATCG ACGTCTGGGT CAACAACGCG ATGGTGACCG CCTACGCGCC GGTGCGGCGG 
CTGAGCCCGG ACGAGTTCCG GCAGGTCACG GCCGTGACCT ATCTGGGCCA GGTGCACGGC 
ACGCTGGCGG CCCTGCGGCA CATGGCACCG GCCGACCGCG GCACGATCGT CTGCATCGGC 
TCGGCGCTCG CCTACCGGTC GATCCCGCTC CAGGCGCCCT ACTGCGCCGC CAAGGCGGCG 
GTGCGCGGCT TCGTCGATTC CCTGCGCTGC GAGATCCTGC ACGACGGCAG CCGGGTGCGG 
CTCACCATGG TGCAGCTGCC GGCGGTCAAC ACGCCGCAAT TCGACTGGGC CCGCTCGGTC 
CTGCCGCGCC GGCTCCAGCC GGTGCCGCCG ATCTACCAGC CCGAGGCGAT CGCCCGGCAC 
GTCGTGCGGG CGGCGGAGGA GGCGCCGCGC GAGCTCTGGA TCGGTCCCCC GGCCTGGCAG 
GCGATCCTCG GCACCCTGGT GGCGCCCGGC CTGCTCGACC GCTACCTCGC CACGGCCGCC 
TACGAGGGCG AGATGACGCC CGAGCCGGCG GACCCGCACC GGCCGGACAA CCTGTTCGGG 
CCGGTCGACA CGGATCCCGG GGCGCATGGC CGCTTCGACG GGCGGGCGCG GGCGAGCGTG 
GTCGCGGCCG CCCCGAGCAC GCTGAAGGCC GGGCTGGCCC TCGGGCTCGG GCTGCTCGCC 
GGCGGGGCGC TGCTCGCCGC GCGGCGGCCG AGGCGGTGA

Protein sequence

MSPRRPSAVV TGGTAGVGRA VALAFARRGY DVAVLARGRR GIDGTLAELR RAGARALGFQ 
ADVADAGAVQ RAADAVAEAW AGIDVWVNNA MVTAYAPVRR LSPDEFRQVT AVTYLGQVHG 
TLAALRHMAP ADRGTIVCIG SALAYRSIPL QAPYCAAKAA VRGFVDSLRC EILHDGSRVR 
LTMVQLPAVN TPQFDWARSV LPRRLQPVPP IYQPEAIARH VVRAAEEAPR ELWIGPPAWQ 
AILGTLVAPG LLDRYLATAA YEGEMTPEPA DPHRPDNLFG PVDTDPGAHG RFDGRARASV 
VAAAPSTLKA GLALGLGLLA GGALLAARRP RR