Gene Csal_1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1840
Symbol
ID	4028066
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2096648
End bp	2097592
Gene Length	945 bp
Protein Length	314 aa
Translation table	11
GC content	67%
IMG OID	637967034
Product	inosine/uridine-preferring nucleoside hydrolase
Protein accession	YP_573891
Protein GI	92113963
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG1957] Inosine-uridine nucleoside N-ribohydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.94695
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGTTC CACTGATTTT CGATACCGAC CCCGGCGTCG ATGATGCCCA GGCCATCGCC 
ATTGCGCTGG CACATCCCGA GATCGAGCTG CTGGGCATGA CCACGACCTA TGGCAATGTC 
GACATCGACA CCGCCACCCA CAACGCCCTG CTGCTGGCCG AGCTCGCCGG CCAGCGAGTC 
CCCGTCGCAC AAGGCGCCGC AGGGCCGCTG GTCAAGCCCA AGCACCCGGC ACCGACGCAT 
ATACACGGCG ACAACGGACT CGGCAACCAT GCGCTGCCCG ACGCACAGGG ACATGCCGAG 
ACGATCTGCG CCGCCCAGTT CATCGTCGAG CAGGTGAACG CCCGTCCGGG CGAGATCACG 
CTGGTCGCCG TCGGCCCTCT GGGCAATCTG GCGGCGGCAT TGCAACTCGA TCCGGGCATC 
GTCGATCGGG TCAAGCAGGT CGTGGTCATG GGGGGCTCGA TTCGCGAGGG TGGCAATGTC 
ACGCCCGTCG CCGAAGCCAA TATTTTCAAC GATCCACACG CGGCGGCACG GGTGCTGACG 
GCGGGCTGGC CGCTGACCCT CGTGGGACTG GACGCCACGC ATCGCTGCGT CCTGGGGCCC 
GCGCACATGG ACAGGATCGC TGCCGCGCAA GGCAGGCTCG GGGAGGTGCT GGCGGGCAGT 
TATGCGTTCT ATCGCGCGTT TTACCGCAAT GCACTCGATA TCGACGGGTG CTGTCCGCAT 
GACAGCTGCG CCCTGGCCTG GCTGATGCGG CCGGAACTCT TCACCAGCGT GCGCGGCCAC 
TTGAGCGTCG TGACCGAGGG GGATGCCGAG GGCCAGACGC TGTTCGCCCC GCAGGAGCGT 
GCCTTCATCG ACCCGCGCTG GTCGCGCACG CCCCTCGTCG AGGTGTGCAT GAACGCCGAC 
GGCGACGCTG TCGTCGCGTG GATCGTCGAC ACCCTGACGG CCTGA

Protein sequence

MTVPLIFDTD PGVDDAQAIA IALAHPEIEL LGMTTTYGNV DIDTATHNAL LLAELAGQRV 
PVAQGAAGPL VKPKHPAPTH IHGDNGLGNH ALPDAQGHAE TICAAQFIVE QVNARPGEIT 
LVAVGPLGNL AAALQLDPGI VDRVKQVVVM GGSIREGGNV TPVAEANIFN DPHAAARVLT 
AGWPLTLVGL DATHRCVLGP AHMDRIAAAQ GRLGEVLAGS YAFYRAFYRN ALDIDGCCPH 
DSCALAWLMR PELFTSVRGH LSVVTEGDAE GQTLFAPQER AFIDPRWSRT PLVEVCMNAD 
GDAVVAWIVD TLTA