Gene Csal_0116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0116
Symbol
ID	4027042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	139207
End bp	140268
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	65%
IMG OID	637965267
Product	uroporphyrinogen decarboxylase
Protein accession	YP_572179
Protein GI	92112251
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0407] Uroporphyrinogen-III decarboxylase
TIGRFAM ID	[TIGR01464] uroporphyrinogen decarboxylase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.754255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCATTGC AAAACGACCG CCTACTGCGT GCCTTGGCGC GCCAACCGGT AGACCGCACA 
CCGGTGTGGA TGATGCGCCA AGCGGGCCGT TATCTGCCCG AATATCGGGA GACGCGCGGC 
CAGGCCGGCA GTTTCATGGA CCTGTGCCGC AACGCCGAAC TGGCGTGCGA GGTCACCATG 
CAGCCGCTTC GCCGCTATGC GCTCGATGCG GCGATCCTGT TTTCCGACAT CCTCACGATT 
CCCGACGCCA TGGATCTGGG GCTGTACTTC GAAACGGGCG AAGGCCCCAA GTTTCGCAAG 
ACGGTGCGCA GCGCCGAGGC TGTGGACGCC TTGCCGGTGC CGGATGCCGA GCGGGATCTC 
GATTATGTGA TGAACGCGGT GCGCACCATT CGCCACGAAC TGGCGGACAG CGTGCCGTTG 
ATCGGCTTTT CGGGCAGCCC CTGGACGCTG GCGACCTACA TGATCGAAGG CGGCTCGAGC 
AAGGACTTCC GGCACGCCAA GGCATTGATG TACGGCGATC CCGCGGCGAT GCACGCGCTG 
CTCGACAAGC TGGCGCGGTC GGTCACCGAC TACCTCAATG CGCAGATTCG TGCCGGAGCC 
CAGATCGTGC AGATCTTCGA CACCTGGGGC GGCGTGTTGT CGACGCCGGC CTACCGCGAG 
TTCTCGCTGG CCTACATGGC GCGCATCGTC GAAGGACTGA TCCGGGAGCA CGAGGGGCGC 
CACGTGCCGG TGATCCTGTT CACCAAGCAG GGCGGCCAGT GGCTGGAGAC CATCGCCGAC 
AGCGGCGCCG ATGCCGTGGG CCTGGACTGG ACCACCGAGC TGAGCGACGC CCGGGCCCGT 
GTCGGGGATC GCGTGGCGCT GCAGGGCAAT CTCGATCCCA ATGTGCTCTT CGCCTCGCCC 
CAGGCGATTC GCGATGAGGT GGCGCGCATT CTGGCCAGCT ATGGCAGCGG TCCCGGCCAT 
GTCTTCAACC TGGGGCATGG TGTCAGCCAA TTCACTGATC CCGATCATGT CGCCGCCTTC 
ATCGAGGCAC TGCATGAACT CAGCCCGCGT TATCATGGCT GA

Protein sequence

MPLQNDRLLR ALARQPVDRT PVWMMRQAGR YLPEYRETRG QAGSFMDLCR NAELACEVTM 
QPLRRYALDA AILFSDILTI PDAMDLGLYF ETGEGPKFRK TVRSAEAVDA LPVPDAERDL 
DYVMNAVRTI RHELADSVPL IGFSGSPWTL ATYMIEGGSS KDFRHAKALM YGDPAAMHAL 
LDKLARSVTD YLNAQIRAGA QIVQIFDTWG GVLSTPAYRE FSLAYMARIV EGLIREHEGR 
HVPVILFTKQ GGQWLETIAD SGADAVGLDW TTELSDARAR VGDRVALQGN LDPNVLFASP 
QAIRDEVARI LASYGSGPGH VFNLGHGVSQ FTDPDHVAAF IEALHELSPR YHG