Gene Mmar10_1020 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mmar10_1020
Symbol
ID	4284360
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Maricaulis maris MCS10
Kingdom	Bacteria
Replicon accession	NC_008347
Strand	-
Start bp	1117561
End bp	1118934
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	63%
IMG OID	638140491
Product	Alpha,alpha-trehalose-phosphate synthase (UDP-forming)
Protein accession	YP_756251
Protein GI	114569571
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0380] Trehalose-6-phosphate synthase
TIGRFAM ID	[TIGR02400] alpha,alpha-trehalose-phosphate synthase [UDP-forming]

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.0332044
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	39
Fosmid unclonability p-value	0.336868
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCCGTC TGATCGCGAT CTCGAATCGA ACCGCCGCCG ACCCGAAGGC CCGCGCCGGC 
GGCCTCGCGG TCGCGGTATG GGAATCCCTC AAGGCGACCG GCGGATGCTG GTTCGGCTGG 
AGCGGCGAAC TGGTCGACGA GATCCCGCGG GGCACCAGCG TCTATCGCGA TGAGGGTGTC 
GAGTTCGTCC TGACCGACCT CACCCATGAC GAACATGAAA GCTATTACCT GACCTACGCC 
AACCGGGTGA TCTGGCCGGT CTTCCATTAT CGGCTCGACC TGGCCAGCTT CGACAGCGAA 
GCCTTCAAGG TCTATTCCGC GGTCAATCAA CGCCTGGCCA ACATGGTCGC TGACCGTCTC 
GTTCCCACCG ACACTGTGTG GGTGCACGAT TATCATTTTC TGTTGATGGG CGACGCCCTG 
CGTCATGCAG GCTGGGAAGG GCCGACCGGT TTTTTCCTGC ATATTCCCTT TCCGCCGCCG 
GAAATGTTCA GCGCCATTCC GGAACACCAC TGGATTGCGC GGGCCCTGTG CGCCTACAGC 
GTGATCGGCT TCCAGTCCGA ACGTGATCGG GCCAATTTCG AGCGCTACCT GGTCGATCAG 
TGCGGTGGCG AAGCGCATGA GGATGGTCGC ATAAGCGTTT TCGGCACCAC AACCCGCATC 
GCGGCCTATC CGATCGGGAT TGATCCGGCC GGGTTCGTCG AAGCGGCACA CTCGCCGGTC 
GCCGACCGGG CCGCCGAACG CATCAGCCGC TTCCTGGGCG GACGCGAGCT GGTGGTCGGT 
GTCGACCGGA TGGACTATTC CAAGGGGCTG CCGCAACGCT TTGAGGCGGT CGGACAGTTT 
TTCGACGATC ATCCCGATCT GCATGGCAAG GTCTCGGTGA CCCAGATCGC ACCGCCATCC 
CGGTCGAAGG TCGAGGAATA TCAGGAGCTG CGACTGGAAC TCGACCAGCT GGCCGGACGG 
ATCAATGGCG ATCATGGCGA TCTGGACTGG ATCCCGCTGC GCTATCTCGC CCGGTCCTAT 
TCCCGCGAGG AACTGGCCGG CCTGTTCCGG ATTGCCCGGG TCGGACTGGT CACCCCCTTG 
CGGGACGGCA TGAACCTGGT CGCCAAGGAA TTCGTCATGG CCCAGGATGA AAGCGATCCG 
GGCGTGCTGG TCCTGTCGCA ATTCGCCGGT GCGGCCGAGC AGATGCAAGA AGCCCTGATC 
GTCAATCCGC ATGATCGCCA CAAGGTGGCC GACGCCATCC ATCAGGCTCT GACCATGCCG 
CTGGAAGAAC GCCAGACGCG GTGGCGCAAG TTGCGCGACA TTGTGGTCAA GCAGGACATC 
GCCTGGTGGC GCAATAACTT CCTGCGGGAT CTCGAGCCCG CCATTCCGGC ATGA

Protein sequence

MGRLIAISNR TAADPKARAG GLAVAVWESL KATGGCWFGW SGELVDEIPR GTSVYRDEGV 
EFVLTDLTHD EHESYYLTYA NRVIWPVFHY RLDLASFDSE AFKVYSAVNQ RLANMVADRL 
VPTDTVWVHD YHFLLMGDAL RHAGWEGPTG FFLHIPFPPP EMFSAIPEHH WIARALCAYS 
VIGFQSERDR ANFERYLVDQ CGGEAHEDGR ISVFGTTTRI AAYPIGIDPA GFVEAAHSPV 
ADRAAERISR FLGGRELVVG VDRMDYSKGL PQRFEAVGQF FDDHPDLHGK VSVTQIAPPS 
RSKVEEYQEL RLELDQLAGR INGDHGDLDW IPLRYLARSY SREELAGLFR IARVGLVTPL 
RDGMNLVAKE FVMAQDESDP GVLVLSQFAG AAEQMQEALI VNPHDRHKVA DAIHQALTMP 
LEERQTRWRK LRDIVVKQDI AWWRNNFLRD LEPAIPA