Gene M446_4035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_4035
Symbol
ID	6132843
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	4501783
End bp	4502817
Gene Length	1035 bp
Protein Length	344 aa
Translation table	11
GC content	63%
IMG OID	641644192
Product	glycosyl transferase family protein
Protein accession	YP_001770832
Protein GI	170742177
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGGTA GGGATCTTAG CCATATTCCA GGCAATAATT CAACTAATAA TCCGCACATA 
TCGGTCGTAA TTTCCGTGAA GAACCGCTTC TTTCTGCTGA AGGACTGCCT GGAAGCTTTG 
CTCAGGCAGA CGATTGGCGT CGAGAGCTTC GAAGTCATTG TCGTCGACAA CGTGTCTCAG 
GACGATATCG CCGGTCTTTG CACGGCGATG CGGGCCCAGG GTCTGCAGCT CCGCTACCTG 
CGCATGCAGC ACGACAAGGG ACCGGCCCCG GCGCGCAACC GAGGCGTGCT TGAGGCGCGG 
GCCCCGCTGA TCGCCTTCAC GGACAGCGAT TGCCGGCCCC ATCCCGAATG GCTCGCCCTT 
GGCATCGCCG CCCTGGCCGA CCCGGCGGTC GCGTTCTCGA CGGGCCCGGT CCTGCCCAAG 
CCGGAGCAAA CGGCATCGCT CTGCTCCAAA CTCACGTTCG TCACGGCGCA GGAGCACCCG 
ACCTTTCCGA CCGCCAACAT GGTCGTGCGG AAAAGCGTGT TCGACGCGTT CGGCGGCTTC 
GACGAAACCC TCTCGTTCCG TGACCCGCTC AACCGGGCGA CGGAATGTGC CGATACCGAT 
CTCGCCTGGC GCATCATCGA GGCCGGCTAC ACCCGCCGCT TCGAGCCGCG CGCCGTCATC 
TGGCACGAGA TCGAACAGCA ATCGCTTCTC CAATGGATTC TCGAGCCGAC ACGATTGTTT 
CTGGTTCCTG CCCTAGTCAA GCGGCATCCG GAACTCAGGA GACGTCTCCT CGTCGCGCGC 
CTGTTCTTCT ATCCTCCGAT ATGGCTGCTT TACCTCGCGG TATGCGTGGC GGCGTTCGCC 
GTCATCTGGC AGCCGCTGCT GCTGCTCGTG CTGCCGCCGG CACTGCTCGC GCGGGGCATC 
CATCGCACCG GCTCCGTGGA CCCGCGGCAG CTCGCAGCCC ACGCCGGGCG TGTGATTGCT 
CACCTGCCGC GGATGGTCGT CATGATAACA TCCCTGCTTT ATGGAAGCAT TCGCTACCGC 
GCACTCGTTC TATGA

Protein sequence

MDGRDLSHIP GNNSTNNPHI SVVISVKNRF FLLKDCLEAL LRQTIGVESF EVIVVDNVSQ 
DDIAGLCTAM RAQGLQLRYL RMQHDKGPAP ARNRGVLEAR APLIAFTDSD CRPHPEWLAL 
GIAALADPAV AFSTGPVLPK PEQTASLCSK LTFVTAQEHP TFPTANMVVR KSVFDAFGGF 
DETLSFRDPL NRATECADTD LAWRIIEAGY TRRFEPRAVI WHEIEQQSLL QWILEPTRLF 
LVPALVKRHP ELRRRLLVAR LFFYPPIWLL YLAVCVAAFA VIWQPLLLLV LPPALLARGI 
HRTGSVDPRQ LAAHAGRVIA HLPRMVVMIT SLLYGSIRYR ALVL