Gene Csal_3231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3231
Symbol
ID	4028565
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	3600609
End bp	3601664
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	66%
IMG OID	637968446
Product	dihydroorotase
Protein accession	YP_575274
Protein GI	92115346
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCGAGT CCCCTACCCG CCTGCGAATC CGTCGCCCCG ACGACTGGCA CCTTCACCTG 
CGCGACGGCG ACGTGATGCG CCTGGTGCTG CCGGCGACCA GCCGTGTCTT CGCACGCGCC 
ATCGTGATGC CCAACCTGAT GCCGCCGGTC ACCACCCTGG ATGCCGCCGA GGCGTATCGC 
GCGCGGATCC TCGAGGCGTT GCCGGCAGGG CATGACTTCA CGCCGCTGAT GACCTGCTAT 
CTCAACGAGA GCGTCAGCGC CGAGACGCTG GAGGCGGGGC ATGCCAGCGG ATTGCTGACG 
GCGGCCAAGC TGTACCCGGC CAATGCCACC ACCAACTCGC AACATGGCGT CAAGCGTATC 
CAGGACATCT ACCCGTTGCT CGAGGTGATG CAGCGCATCG GCATGCCGCT GCTGGTGCAT 
GGCGAAGTCA CGCGTGGCGA GATCGACATC TTCGATCGCG AAAAGGCCTT CATCGACGAG 
GTGATGACAC CGCTGTGCGA GCATTTCCCG GCGCTCAAGG TGGTGTTCGA GCACATCACC 
ACGGCGGAGG CGGCGCAGTA CGTCCTGGAG GGCAACGACA ATCTGGCCGC GACGCTGACG 
CCGCAGCACC TGGCGCACAA TCGCAACGAC ATGCTGGTCG GCGGCATTCG CCCGCACCTT 
TATTGCCTGC CGATCCTCAA GCGCGCCGAG CACCAGCGGG CGCTGCGCGC GGCGGTCGCC 
AGCGGTCATC CGCGGTTCTT TCTGGGCACC GACTCGGCAC CGCACGTGGT CGCCGCCAAG 
GAGACCAGTT GCGGCTGTGC CGGGGTGTTC AACGCCCAGG CCGCGCTCTC GGTCTATGCG 
GAGGTATTCG AGGAAGAAGG CGCGCTCGAG CACTTCGCGG CGTTCTGCTC GGAAAACGGG 
CCGCGCTTCT ATGGCCTGCC GCTCAACGAG GATCACATCG AGCTCGTGCG CCAGCCGACG 
ACCATGCCCG AACGCATCGA AGGCCATGGC GAAACGTTGA AGCCCTTCAA GGCCGGGGAA 
ACCCTGGCCT GGACGGTCGC CGCCGGGCGC GATTGA

Protein sequence

MSESPTRLRI RRPDDWHLHL RDGDVMRLVL PATSRVFARA IVMPNLMPPV TTLDAAEAYR 
ARILEALPAG HDFTPLMTCY LNESVSAETL EAGHASGLLT AAKLYPANAT TNSQHGVKRI 
QDIYPLLEVM QRIGMPLLVH GEVTRGEIDI FDREKAFIDE VMTPLCEHFP ALKVVFEHIT 
TAEAAQYVLE GNDNLAATLT PQHLAHNRND MLVGGIRPHL YCLPILKRAE HQRALRAAVA 
SGHPRFFLGT DSAPHVVAAK ETSCGCAGVF NAQAALSVYA EVFEEEGALE HFAAFCSENG 
PRFYGLPLNE DHIELVRQPT TMPERIEGHG ETLKPFKAGE TLAWTVAAGR D