Gene Csal_1722 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1722
Symbol
ID	4028830
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1960938
End bp	1962059
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	66%
IMG OID	637966910
Product	UDP-galactose 4-epimerase
Protein accession	YP_573773
Protein GI	92113845
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.202169
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGATTT TAGTGACGGG CGGGGCCGGG TACATCGGCT CGCATATGGT GCTGCGGCTC 
ATCGAAGCCG GCCACGAGGT GGTCGTGATC GACAACCTCT GCAATGCCTC GCGAGAGTCG 
CTGGAGCGCG TCTCGCAGTT GACCGGCAAG GAGGTGACCT TCATCGAGGG CGACATTCGC 
GATCGTTCGC TGCTGGATTA CGTGTTCGCG GACTTCGAGA TCAGCGATGT GCTGCATTTC 
GCGGGTCTCA AGTCGGTGGG CGAGAGCGTC AGCGAGCCAC TGGCGTATTT CGAGAACAAC 
GTGGCGGGCA CCATCACGCT GTGCCAGGCG ATGACGGCGG CGGGCGTGTA CCGCCTGGTG 
TTCAGTTCCT CGGCGACGGT GTATGGCGAC GCCACGCGCA TGCCGTTGAG CGAAAACGCG 
CCTACCGGGC AACCGACCAA CGCCTACGGG CATTCCAAGC TGATGGTCGA GGAGGTGCTG 
CGCAAGCTGG CGCGGTCCGA CCCACGCTGG GCGATCGCCT TGTTGCGCTA CTTCAACCCG 
GTGGGGGCGC ACCCCAGTGG CATGATCGGC GAGGACCCGT CGGGCACGCC CAACAATCTG 
CTGCCGTTCA TCTCGCAGGT GGCGATCGGT CGGCTACCGG CGCTTTCGGT CTTCGGCGAC 
GACTATCCGA CGCCCGATGG CACCGGGGTG CGCGATTACA TCCATGTGAT GGATCTGGTC 
GAGGGACACC TGGCGGCAAT GCGCGTGCTG GCGGATCGTG CGGGCGTGAA CGTCTGGAAC 
CTGGGCACGG GGCAGGGCTA CTCGGTACTG GAGATGGTGC GCGCCTTCGA GCATGTCGCC 
CGGCGCGACG TGCCGTATCG CATCGTGCCG CGTCGCGACG GCGATATCGC CGCATGCTGG 
GCCGACGCCT CGCTGGCCGA GCGTGAGCTG GGCTGGCGGG CGCAACGCGG CCTGATGGAC 
ATGATCGCCG ATACCTGGCG CTGGCAGTCG CGCAACCCCG AAGGCTACCC GCGCAAGCGC 
ATGATCCGGC GCGAGACCGT CGGGGCCGCG CGTGCCGTGG GCGCCGGCTT GCCCCGTATC 
TATCTGATAG ACACCGCGCG GGCCAACTCC GTGGCGTCGT AG

Protein sequence

MTILVTGGAG YIGSHMVLRL IEAGHEVVVI DNLCNASRES LERVSQLTGK EVTFIEGDIR 
DRSLLDYVFA DFEISDVLHF AGLKSVGESV SEPLAYFENN VAGTITLCQA MTAAGVYRLV 
FSSSATVYGD ATRMPLSENA PTGQPTNAYG HSKLMVEEVL RKLARSDPRW AIALLRYFNP 
VGAHPSGMIG EDPSGTPNNL LPFISQVAIG RLPALSVFGD DYPTPDGTGV RDYIHVMDLV 
EGHLAAMRVL ADRAGVNVWN LGTGQGYSVL EMVRAFEHVA RRDVPYRIVP RRDGDIAACW 
ADASLAEREL GWRAQRGLMD MIADTWRWQS RNPEGYPRKR MIRRETVGAA RAVGAGLPRI 
YLIDTARANS VAS