Gene Cmaq_1952 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1952
Symbol
ID	5709856
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	2029240
End bp	2030622
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	45%
IMG OID	641276460
Product	UDP-glucose/GDP-mannose dehydrogenase dimerisation
Protein accession	YP_001541758
Protein GI	159042506
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0677] UDP-N-acetyl-D-mannosaminuronate dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.868357
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTAATC TTAATCTATT GTTGATGAGT AATGAGGATT TAGTTAATGC CTTGAGGAGT 
GGTTCATTAA CCGTATCCGT TTACGGCATG GGTTACGTAG GTACTGCCAT TGCTGCCGTA 
TGGCTTAGGG CTGGTGCCAG GGTTATTGGT GTTGATGTTG ATGCTGAGAA GATTAAGAAA 
CTGGATGCCT GTGAACTTAA GTTAAGTGAT AGGCAGGTTG AGGAGGAGTT GAGGAGGCTT 
AAGGATAGGA TAAGCTACAC CACTGATGGT GTTGAGGCAT CGAGGTTAAG TAATGTGAAG 
ATTGTTACTG TCCCAGTTTA CTTAGGTAAG GATAAGAGAC CAATCTTCGA TTCCTTTAAG 
GCTTCAATAG AGAATATTGC CAGGGGGCTT AAGGTCGGTG ACTTAGTCAT AATAGAGTCC 
TCTGTTCCCC CTGGCACAAC AATGGATGTT GCCTTACCCA TCCTGGAGAG GATTAGTGGA 
TTAAGGGTTG AGAGGGATTA TGCATTAGCC TACTCGCCTG AACGCATCTA CGTTGGTAGG 
GCTATTGCTG ATATTGAGGA GCGTTATCCT AAGGTTATTG GTGGTGTTGG ACCCATTAGT 
AGCAGGGTTG CGTCCACATT ATACGGTGCC ATAGCTAGGA AGGGTACCTT AATTTTATCC 
AATCCAACAG CCGCTGAGTT TGAGAAGCTT GCGGAGGGTG CTTATAGGGA CGTGAACATA 
GCGTTGGCTA ATGAGCTTGC CCAATTAGCT AGGTTACTTG GATTAGATTT CGATGAGATA 
AGGGAGGCGG CTAATAGTCA ACCCTACTCT AATATTCATA AGCCTGGCCC AGGGGTTGGT 
GGATCATGCA TACCAGTGTA CCCCTACTTC CTAATGTATG CTGCTGAGAG GGCTGGCTTC 
AACATGAAGC TTGTTCAAAC AGCCAGGGGT ATTAATGAGT ATGCGCCCGC TTATGTGGCT 
GAGTTGATTA AGACTGCTGC GGGTGAATTA GGGGTTAGTA GGCCTAGGGT GGCTGTGTTG 
GGTTTAGCCT TTAGGGGTAA TGTTGATGAC ACTAGGCTTA GTCCATCATA CGACATAATT 
AATTACCTAA GGGGTTCAAT GGATATTATT GTTCATGATC CATACGTTAA ATTCGATAAA 
ACCCTTGAGG AATGGGGGAT TAGGTTAACT AACAGTATTG AGGATGCGTT AAAGGGGGCT 
AACATAGTGG TGATAGCAAC AGATCACAGT GATTACGGTG GGTTAACGTT AAGTAGGATT 
ATTCAATTAA CAGGCTTAAG CAGTATTGCC GTAGTGGATT CAAGGCACAT GATTAAGGAT 
TGGAGAAACC CACCCCCGGG TGTTGTTTAC CTGGCTGTGG GTAGACCCAC TGCAAAGGCG 
TGA

Protein sequence

MGNLNLLLMS NEDLVNALRS GSLTVSVYGM GYVGTAIAAV WLRAGARVIG VDVDAEKIKK 
LDACELKLSD RQVEEELRRL KDRISYTTDG VEASRLSNVK IVTVPVYLGK DKRPIFDSFK 
ASIENIARGL KVGDLVIIES SVPPGTTMDV ALPILERISG LRVERDYALA YSPERIYVGR 
AIADIEERYP KVIGGVGPIS SRVASTLYGA IARKGTLILS NPTAAEFEKL AEGAYRDVNI 
ALANELAQLA RLLGLDFDEI REAANSQPYS NIHKPGPGVG GSCIPVYPYF LMYAAERAGF 
NMKLVQTARG INEYAPAYVA ELIKTAAGEL GVSRPRVAVL GLAFRGNVDD TRLSPSYDII 
NYLRGSMDII VHDPYVKFDK TLEEWGIRLT NSIEDALKGA NIVVIATDHS DYGGLTLSRI 
IQLTGLSSIA VVDSRHMIKD WRNPPPGVVY LAVGRPTAKA