Gene M446_1673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_1673
Symbol
ID	6134832
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	1869487
End bp	1870554
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	79%
IMG OID	641641931
Product	glycosyl transferase, group 1
Protein accession	YP_001768600
Protein GI	170739945
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5653] Protein involved in cellulose biosynthesis (CelD)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.198509
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGAAGCT TCGCCGCGGC GCCGACCGGC CGGCCGCTCC CCATCGCCTC GCCGGCGCGG 
CGTGAGGCGC CGGCCCTCAC CGCGTCCGTC CTCGCCGAGG CGGCCGACCT CGACCGGCTC 
GAACCCGACT GGTGGGACCT GTTCGGGCGC TGCCCCTCCG CGACGCCGTT CCAGTCCCCG 
GCCTGGCTCA TCCCGTGGTG GCGCCAGTTC CGGCCCGGCG ACCTCGCCGC GGTGGCGGTC 
CGGGCGGGCG GGCGCCTGGT CGGCCTCGCG CCGCTCTACG CGGAGGAGGG CGCGCGGGGC 
CGGCGCCTCC TGCCGCTGGG CATCGGGCCG AGCGACCATC TCGACCTCCT GCTCGACCCG 
GAGGCGGCCG GGGCGGGCGC GGCGCTGGCG GAGGGGATCG CGGCCGCGCG GGGCGGCTGC 
GCCACCCTGG ACCTGGAGGA CCTCGCGCCC GAGGCCGCCG CCTGGCAGCT CCCGGTGCCG 
GCGGGGGCCG CCGAGCGCGT CGAGGACCAG GTCGCCTGCC CGGTGCTGCT GCTGCCGCGC 
GAGGCCGCCA GCCTCGCCGA CCTCTGCTCC TCGCAGAAGC GCCGCAAGAT CGCGCTCGCC 
CGCAACCGCT CGCTGCGGCG CGGCGGCTTC CAGGTCGAGG CCGCCACCTC GCCCCGGGAG 
ACGGCCGCCC TGTTCGAGCG CCTCGCGGCG CTGCACGCCG CGCGCTGGGA GAGCCGCGGG 
GAGGCCGGCG TGCTGGCGGA CCCGGCCGTG CAGGCCTTCC ACCGCGAGGC GGTGCCGCGC 
CTCGCGCGCG CCGGCCTCGT GCGCTTCCAC GCGGTGCGGC TCGCCGGCGA GGTCGCCGGG 
ATCCTGTACG CCCTGCGCGG CCGGCGGCGG GTCTACACCT ATCTCAGCGG CTTCGATCCG 
GCCTTCGCCT TCGAGAGCCC AGGCGTGACG CTGGTCGCCG CCGCCCTCGA CGCGGCCCGG 
GAGGAGGGCG CGCGCGCCTT CCACTTCCTG CGCGGCCAGG AGCCCTACAA GTACGAGTGG 
GGCGCGGTCG ACATCTGGAA CCGCCGCCGG AGCCTGCGAT GGAGCTGA

Protein sequence

MRSFAAAPTG RPLPIASPAR REAPALTASV LAEAADLDRL EPDWWDLFGR CPSATPFQSP 
AWLIPWWRQF RPGDLAAVAV RAGGRLVGLA PLYAEEGARG RRLLPLGIGP SDHLDLLLDP 
EAAGAGAALA EGIAAARGGC ATLDLEDLAP EAAAWQLPVP AGAAERVEDQ VACPVLLLPR 
EAASLADLCS SQKRRKIALA RNRSLRRGGF QVEAATSPRE TAALFERLAA LHAARWESRG 
EAGVLADPAV QAFHREAVPR LARAGLVRFH AVRLAGEVAG ILYALRGRRR VYTYLSGFDP 
AFAFESPGVT LVAAALDAAR EEGARAFHFL RGQEPYKYEW GAVDIWNRRR SLRWS