Gene M446_5945 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5945
Symbol
ID	6132761
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	6535756
End bp	6536988
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	72%
IMG OID	641646047
Product	capsular polysaccharide biosynthesis protein-like protein
Protein accession	YP_001772659
Protein GI	170744004
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4421] Capsular polysaccharide biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.146298
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCACCCG AACACGATCT GGTCCCGGTC TCATGCGACC TCGACCGCCT GTACCGGTCG 
GACGGCTCCT CCGAACTGGC GGACGCGCTG CCCCCGATGG AGCCCTCCAG CCCCGACATC 
GACTTCGTCG ACGACCTGTT CCCCGCCTAC GCGTACGAGC GGCCGGCCCC CCTCACGCAG 
GTCTGCGGGG ACGAGGAGGC GGCGCGGCAC ATGCGGCAGA TCGAGAGCGA CATGGCCCGG 
GGCGCCCGGC GGGGCGCGGC CTCGGCCCTG TTCCGCATCC GCGACGCCGT CCTGTACGAC 
AACGTCATCC ATCTCCTGCG CGGCGCGCGC CGCGCCGTCG TCTACGAGAC CGCGCGGCCG 
CAGGACCTCG CGCATTTCCC GCTCGACCAG GCGCCGCACC CGATCCGGGA CCAGGATTCC 
TCCGACGGCG CCCTCAACCT CGTCTTCACG AACTCCGCCT CGTTCAATTA CGGCCACTGG 
CTGGTGGAGG ATCTGCCGCG GCTGAAGGCG GTCCGGGTGC TCCGGCGCCG CTTTCCCGGC 
CGGCCCATCA ACCTGATCAT CACGACCTAT CACGAGATCA TCGACCAGGT GCGGCTGCGC 
TCGATCAAGC TGATGCTCGA GGGCCTGCGG GGGATCCGGA TCGTGACGAT CACGCGCGAC 
CAGCCGCTGC ATTTCGACGT GCTGCACTTC GCCTCGCCGA TCGCCCTGCA CCCGGTGCTG 
AAATCCCCCG AGGCGCTCGC CTTCCTGGCC GGGACGCTGC GGCGCCGGGT GCTGCTCGCG 
CGCCTGCGCA TCGCCCGCGA CGCCCTGCTG GCGACGCCCC GGCGCCGGCC CCTGCGGCGG 
CGGCTCTTCG TCGACCGCGC GCCGGATTAC GGGCGCCGCC TCCTCAACCG GGACGACGTG 
CTGGCGCTCC TGTCCGGCGA GGGTTTCGAG GTGGTCGATC CCCTGACCCT GCCGTTCGGC 
CAGCAGGTCG CGCAGTTCGC CGATGCCGGG GTGGTGGTGG GCGGCATGGG GGCCGCCATG 
ACCAACACGC TGTTCAGCCT GCCCGGGACG CAGGTGATCC ACCTCGCGGC CGAGGGCTGG 
AACGACCCGT TCTTCTGGGA CCTCGCGGCG GTGCGCGGGC ACCGCTACCA CGCGCTCTAC 
GGCGCGAGCG ACTCGAAGGA GCGGCCGAAC CACGGCGCCT TCACGATCGA CCTCGACGCC 
CTGCGGGCCG CCCTGCGGGC GGCGACCGCC TGA

Protein sequence

MAPEHDLVPV SCDLDRLYRS DGSSELADAL PPMEPSSPDI DFVDDLFPAY AYERPAPLTQ 
VCGDEEAARH MRQIESDMAR GARRGAASAL FRIRDAVLYD NVIHLLRGAR RAVVYETARP 
QDLAHFPLDQ APHPIRDQDS SDGALNLVFT NSASFNYGHW LVEDLPRLKA VRVLRRRFPG 
RPINLIITTY HEIIDQVRLR SIKLMLEGLR GIRIVTITRD QPLHFDVLHF ASPIALHPVL 
KSPEALAFLA GTLRRRVLLA RLRIARDALL ATPRRRPLRR RLFVDRAPDY GRRLLNRDDV 
LALLSGEGFE VVDPLTLPFG QQVAQFADAG VVVGGMGAAM TNTLFSLPGT QVIHLAAEGW 
NDPFFWDLAA VRGHRYHALY GASDSKERPN HGAFTIDLDA LRAALRAATA