Gene Csal_2287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2287
Symbol
ID	4026440
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2575837
End bp	2576868
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	67%
IMG OID	637967491
Product	dihydrouridine synthase TIM-barrel protein nifR3
Protein accession	YP_574336
Protein GI	92114408
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGACCC ACGTCTCATC TCAGGCGATG CCGTTGCCGC GAATCGGCGC CTACGCATTG 
TCCAGCCGAG CGATTCTCGC GCCCATGGCC GGCGTGACGG ATCGCCCGTT TCGTCAGTTG 
TGCCGGGAGC TGGGCGCGGG GCTGGTGGTA TCCGAAATGG TGACGTCCGA CACGCGCCTG 
TGGCATACCC GCAAATCGCG CCAGCGCCTC GACCACACCG GCGAGCCCGG CCCGCGTGCC 
GTGCAGATCG CAGGCGGCGA TGCCGCGATG CTGGCCGAGG CCGCGCGCCT CAACGTTGCC 
CAGGGCGCCG AGATCGTCGA CATCAACATG GGCTGCCCGG CCAAGAAGGT ATGCAACAAG 
GCCGCCGGCT CGGCATTGTT GCGCGACGAA CGCCTGGTCG CGGAGATCCT CGAGGCGGTC 
GTCGCCGCCG TGGATGTCCC GGTGACCCTG AAGATTCGAA CCGGCTGGTG TCCGCAAACC 
CGCAATGGCG TACGGGTCGC CAAGCTTGCC GAGTCGGCGG GCATCCAGGC CCTTGCCGTG 
CATGGGCGCA CGCGTGAGCA GCGCTATCGC GGCGAGGCCG AATACGACAC CATCGCCGCC 
ATCAAGCAGG CGGTCTCGCT GCCGGTCTTC GCCAACGGCG ACATCGACGG CGCCGAGAAA 
GCTGCCCGCG TCCTCGACTA CACTAAGGCG GATGCAGTGA TGATCGGCCG CGGCGCCCAG 
GGCAATCCCT GGATCTTCCG CGAGATCGAT CACTACCTGC GTACCGGCGA CTGCCTGCCG 
CGCCCGACGC CCGACGATAT CGCCACCCTG ATGCACCGTC ATCTCGAGGC ATTGCATGCC 
TTCTACGGTG AGCACATGGG CGTGCGCATC GCGCGCAAGC ATGTCGGCTG GTATCTGGCG 
ACGCAACCGC AAGCCGCGGC ACTACGCGCA CGCTTCAACG TACTGGAACA GCCCTCGGCC 
CAACACCGTT TCGTGGATGC CTTGGCCCAC GACACGCTGG AACTGGCCTC AACTGGAAGC 
AATGCAGCAT GA

Protein sequence

MPTHVSSQAM PLPRIGAYAL SSRAILAPMA GVTDRPFRQL CRELGAGLVV SEMVTSDTRL 
WHTRKSRQRL DHTGEPGPRA VQIAGGDAAM LAEAARLNVA QGAEIVDINM GCPAKKVCNK 
AAGSALLRDE RLVAEILEAV VAAVDVPVTL KIRTGWCPQT RNGVRVAKLA ESAGIQALAV 
HGRTREQRYR GEAEYDTIAA IKQAVSLPVF ANGDIDGAEK AARVLDYTKA DAVMIGRGAQ 
GNPWIFREID HYLRTGDCLP RPTPDDIATL MHRHLEALHA FYGEHMGVRI ARKHVGWYLA 
TQPQAAALRA RFNVLEQPSA QHRFVDALAH DTLELASTGS NAA