Gene M446_4034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_4034
Symbol
ID	6132842
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	4500409
End bp	4501533
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	72%
IMG OID	641644191
Product	glycosyl transferase group 1
Protein accession	YP_001770831
Protein GI	170742176
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCCATG ATCTGTCGCA GCGCTTGGCG GCCCGCGGCC ACGACGTCAC CGTCCTGACC 
AGTTCTCCCG CGTCCGAAAC GCGGATCGAA GCCGATGGCC CGGTCCGGCG CGTCCTGCTT 
CGCCGCAGAA CCGGGCCGGC CGCGCTGACG GGCCGCTGGT TCAACAGCCA GCATCTGTTC 
GGCTGGGACT TGGCCAGGTG GCTCCGTGCG GAGCCGTTCG ACGCCGTGCA CTGCTTGAAC 
TACCACGATG CGGTCGGCGC TCTGATCGCG CGCCGGGCGG GTGCACGGTT CCGCCTCGTC 
TTTCAGTGTA CGGGCATTCC GGTGCGGCGC TACTTCCGGC GCATTCCCGC CGACGGCCTG 
ATGTTCCGCA TGGTGCTGCG GCAGGCGGAT GCCGTGGCGG TCCTGTCCCG CTTCGCTCAG 
GACGCGCTCG CGCGGGATTA CGGGGTCGCC GGGACGTTGC TTGCGTCCCC CACCGAGACC 
GCTCCCTTCG AGGCGCTGCC GGACGACGCT CCGCGCGAAC CCTACATCCT GTTCAGCGGG 
GATGCCGACG AGCCGCGCAA AGGCGCACTC CTCCTCGCCC AGGCGTTCCC GGCCGTGGCC 
GAGCGGCTGC CGGCTCTCCG GCTCGTCTAC ACGGGACGAT CGAGCCCGGC CACCCGCGCG 
GCTTTGTCCG CTGCCGTTCC GGGCAACCTC CGCGATCGAG TCGAATTTCT CGGTCTCGGC 
CGCGTCGAGG ACCTGCCGCA CCTCTACGCA CGCGCGACGG TCTGCGTGAA CCCGGCCGTC 
TGGGAGGCGC TGGGCAATGT CCTGATCGAA GCCCTGGCGG CCGGAACCCC GGTGGTCGGC 
GCGCGGCACG CCGGCATCCC GGACATCGTC GCGGACGAGA CGGTGGGGGC TCTGTTCGAT 
CCGGGCTCGA CGCGGCTGGC CGCCACGAAC GCGGCCGGAC TGAGCGAGGC CATCCTGAGG 
GCTGCGGCCC TGGCCGCGCG GCCCGAGACC CGCGCGCGGT GCCGCGCGCG GGCGCAGGCC 
TTCTCCTGGA ACGCCCTGAT CCCCCGCTAC GAGGGCCTGC TCGGCGGCGA CGCCCCGCCG 
CGCGAGATCG GCCCTCCCCT GCCCGCCGCC ATCCCGTTGC GATGA

Protein sequence

MLHDLSQRLA ARGHDVTVLT SSPASETRIE ADGPVRRVLL RRRTGPAALT GRWFNSQHLF 
GWDLARWLRA EPFDAVHCLN YHDAVGALIA RRAGARFRLV FQCTGIPVRR YFRRIPADGL 
MFRMVLRQAD AVAVLSRFAQ DALARDYGVA GTLLASPTET APFEALPDDA PREPYILFSG 
DADEPRKGAL LLAQAFPAVA ERLPALRLVY TGRSSPATRA ALSAAVPGNL RDRVEFLGLG 
RVEDLPHLYA RATVCVNPAV WEALGNVLIE ALAAGTPVVG ARHAGIPDIV ADETVGALFD 
PGSTRLAATN AAGLSEAILR AAALAARPET RARCRARAQA FSWNALIPRY EGLLGGDAPP 
REIGPPLPAA IPLR