Gene Mmar10_0544 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_0544
Symbol
ID	4285825
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	+
Start bp	638440
End bp	639513
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	65%
IMG OID	638140009
Product	glycosyl transferase family protein
Protein accession	YP_755775
Protein GI	114569095
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	0.0412262
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGACTGC AAAGTCAGGC ATCGGCAGGG CCGGGCACCA TCACCATCAT CACGGCCACC 
CATAACCGGC CCGACGCCCT TCGTCTGGCG ATCAGCAGCG TGCTCAATCA GACCCACGCC 
AACTGGCGTC TCCTTGTCGT CGGCGATCAC TGCGATCCGC GAACAGGCGC GGTGATTGCG 
GCATTTGGCG ATCCGCGGAT CCACTACGTC AACCTGCCTC ACAGATGCGG CGAGCAGTCG 
GGTCCCAATT CGGTCGGCAT GGCGCTGGCC AGGACGCCCT TCACCGCCTT TCTCAATCAT 
GACGATCTCT GGTTTCCCGA TCACCTCGAG ACCGGGCTGG GCAGGCTGGA TGAAGAAAAA 
GCCGACTTTT TCGCCGGGCG CGCGGCATTC CTGGAGACTG GCGCTGCGGA AACGGACGAT 
CTGGTCATCA GCGACGTGAC CCCGGACGAC CGCTCGCTTG CCGGCGCCTT TGTTCATACA 
CCGGCCTATT TCGAGCCGGT CAGCACGTGG ATCCTGCGTA GCGAGGCCTG TCGGCGCGTC 
GGGCCCTGGC GGGCGTCGAC CGAGCTTTAT CGCACGCCGC TGGAAGACTG GGTCCTTCGG 
GCCTGGCGCA CTGGCCTGAA ACTGGTCGGT GAGGAACGGG TCAGCGTGAT AAAGCCACGG 
CTTCTGGCCC GGCTCGCTGC CGATGTGAAG GCCTATGACC GCCATCCGCC AGGCCTCGAC 
AGGATTGCTG ACGATATCAC GCGCGCACCC GACCAGGTCC GCAGCGGTAT TGCATCCTGG 
CTTCTCGACA GGTCGGTGGA CGGTCAGCCG GGCGGTTTTG ACTATCGTGC GGATGGCGGC 
GAGCTTCATG CACGAGCGGC CCGGATGTTG ACCCCGGCGA GCGCGGAGGA TTTTCACCGC 
ACGGGGCTGG ACGTCATGGA CCGGGTGTGT CGGGACAGCG GACAGGCGTG CGGTCATGTC 
CTGCGCTGGG CCTTGGGGCG TCGCACTGGC GAGGAATTGC CCGAACGCCC CGCGCTGACG 
ACCTTGCTCG AAGCAGCCCG CGCTCAATTG CAGGCGGATT TCGGCGATGC TTGA

Protein sequence

MGLQSQASAG PGTITIITAT HNRPDALRLA ISSVLNQTHA NWRLLVVGDH CDPRTGAVIA 
AFGDPRIHYV NLPHRCGEQS GPNSVGMALA RTPFTAFLNH DDLWFPDHLE TGLGRLDEEK 
ADFFAGRAAF LETGAAETDD LVISDVTPDD RSLAGAFVHT PAYFEPVSTW ILRSEACRRV 
GPWRASTELY RTPLEDWVLR AWRTGLKLVG EERVSVIKPR LLARLAADVK AYDRHPPGLD 
RIADDITRAP DQVRSGIASW LLDRSVDGQP GGFDYRADGG ELHARAARML TPASAEDFHR 
TGLDVMDRVC RDSGQACGHV LRWALGRRTG EELPERPALT TLLEAARAQL QADFGDA