Gene Csal_1761 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1761
Symbol
ID	4028288
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2006066
End bp	2007406
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	65%
IMG OID	637966949
Product	UDP-glucose 6-dehydrogenase
Protein accession	YP_573812
Protein GI	92113884
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1004] Predicted UDP-glucose 6-dehydrogenase
TIGRFAM ID	[TIGR03026] nucleotide sugar dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.385474
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATCA GTATCTTCGG TACGGGATAC GTGGGCCTGG TCACCGGGAC TTGCCTGGCG 
GACGTGGGGC ACGAGGTCAT GTGCATGGAC GTCGACGCTG ACAAGATCGC CCGCCTCGAG 
CGCGGCGAGA TCCCCATCTA CGAGCCGGGG CTGGACGCCA TGGTGCGTCA GAACGTGAGC 
GAGGGCCGGC TGCGGTTCAC CACCGATGCC GCCACCGCCG TGGGCTTCGC GCCGTTGCAG 
TTCATCGCCG TGGGCACGCC CCCGGACGAG GATGGCAGTG CCGATTTGCA GTACGTGCTG 
GCCGTGGCGC GCAGCATCGG CCAGCACATG CAGGACGACA AGGTCGTCGT CGACAAGTCG 
ACCGTGCCGG TGGGCACTGC GGACAAGGTG CGCGCCGCCG TTCAGCAGGA GCTCGATGCC 
CGCGACGCTG CGCTCACCGT GGATGTCTGC TCCAATCCCG AGTTCTTGAA GGAAGGCGCC 
GCCATCGAGG ACTTCACGCA TGGCGCACGG ATCATCGTGG GCACCGATGC CGAGCGGGTG 
CGCGAGATCA TGCGTGAATG CTACGGTCCC TATAACCGGC ACCATGAGAA GTTGATGTTC 
ATGGATATCC GCAGCGCCGA GCTGACCAAA TACGCGGCCA ACGCCATGCT CGCCACCAAG 
ATCAGCTTCA TGAACGAGAT CGCCAATCTC GCGGAGCGTC TCGGGGCGGA CATCGAACAG 
GTGCGGCGCG GCATCGGCTC GGACCCGCGC ATCGGGTATC ACTTCATCTA TCCGGGATGC 
GGCTACGGCG GCTCCTGCTT TCCCAAGGAC GTGCAGGCAC TGGCGCGCAC CGCCGGCGAG 
ATCGGCTACC ATGCCGAGCT ACTCGAAGCG GTCGAAGGCG TCAACCAGCG TCAGAAGGCC 
ACCCTGTTCG CCAAGCTCTC GCAAGCCTTC GACGGCGATC TGGCCGGCAA GACCATCGCG 
CTCTGGGGGC TGGCCTTCAA GCCCAACACC GACGACATGC GCGAGGCCCC GAGTCGCGCC 
TTGATGGAAG CGCTGTGGGA ATGCGGCGCC CGGGTGCAGG CCTTCGACCC GGAGGCCATG 
GACGAATGCC GGCGGATCTA CGGCAAGCGC GACGACCTGG CACTGGTCGA TAATCGCGAG 
CAGGCCATCG AGGGGGCCGA CGCCCTGGTG ATCTGTACCG AATGGAAGGC GTTCTGCAGC 
GTGGATTTCG CCTGGCTCAA GCAGTCGCTG AGCACACCGG TGGTCGTCGA CGGCCGCAAC 
CTGTTCGATC CGCAGGCGGT CAAGCGCGCG GGATTGTTGT ACTTCGCGGT GGGGCGCGGG 
GATTCCTTGC GTACGCCATG A

Protein sequence

MKISIFGTGY VGLVTGTCLA DVGHEVMCMD VDADKIARLE RGEIPIYEPG LDAMVRQNVS 
EGRLRFTTDA ATAVGFAPLQ FIAVGTPPDE DGSADLQYVL AVARSIGQHM QDDKVVVDKS 
TVPVGTADKV RAAVQQELDA RDAALTVDVC SNPEFLKEGA AIEDFTHGAR IIVGTDAERV 
REIMRECYGP YNRHHEKLMF MDIRSAELTK YAANAMLATK ISFMNEIANL AERLGADIEQ 
VRRGIGSDPR IGYHFIYPGC GYGGSCFPKD VQALARTAGE IGYHAELLEA VEGVNQRQKA 
TLFAKLSQAF DGDLAGKTIA LWGLAFKPNT DDMREAPSRA LMEALWECGA RVQAFDPEAM 
DECRRIYGKR DDLALVDNRE QAIEGADALV ICTEWKAFCS VDFAWLKQSL STPVVVDGRN 
LFDPQAVKRA GLLYFAVGRG DSLRTP