Gene Sala_0680 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0680
Symbol
ID	4082977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	688516
End bp	689586
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	72%
IMG OID	638009039
Product	dihydroorotate dehydrogenase 2
Protein accession	YP_615734
Protein GI	103486173
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0167] Dihydroorotate dehydrogenase
TIGRFAM ID	[TIGR01036] dihydroorotate dehydrogenase, subfamily 2

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.233007
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGCTTT TCGCTTCGCT CACCGACGCC GCCTATGCGC TCGCCCGCCC GCTCGTCCAC 
GCCACCGATG GCGAGGCCGC GCATAATCTG ACGCTCGCCG CGCTCCAGCC GCTGCCGCGC 
GCGCGCCATG CCCTGACCAG CCCGATGCTC GCGACCGAGC TTGCCGGACT GCGCTTCCCC 
AACCCGGTCG GGCTGGCCCC CGGTTTCGAC AAGGACGCGC GCGTCGCGCA TGCGATGCCG 
CATTTCGGCT TCGGCTTTGT CGAGGTCGGC ACGCTCACCC CGCTGCCGCA GGAGGGCAAT 
CCGCGCCCAC GGCTGTTCCG GCTGGTCGAG GATCGCGCGA TCATCAACCG CATGGGCTTC 
AACAATGGCG GACAGGTCGC CGCCGCCGAG CGCATCGCCT GCCTGCGCCG CCATGGGCTG 
CCGGTGCCGC TCGGCATCAA TATCGGCGCG AACAAGGACA GCGCCGACCG CATCGCCGAC 
TATGCGAAGG GCACGGCGGC GATGGCGCCG CTCGCCGATT ATCTTACCGT CAATATCAGC 
TCGCCGAACA CGCCCGGACT GCGCGCGCTG CAGGACAGGG GGGCGCTCGA GGCGCTGCTC 
GACGGCGTCG CCGCGGCGCA GCCGGCGGGG GCGGCGAAGC CCGTCTTCCT GAAGGTCGCA 
CCCGACCTCG AACCCGCCGA CATCGACGAC ATTGTGGCGG TGGCGCTCGA TAGGGGGCTC 
GCGGCGGTGA TCGTGTCGAA CACGACCGTA GCCCGGCCGC CGCTGGCCTC GCGCCACGCC 
GTCGAAGCCG GTGGCCTGTC GGGCGCGCCG CTCGCGCAGC TCGCGCTTCA GTGCGTGCAG 
GATTTCCGCG CCGCGAGCGG CGGCAGGCTG CCGCTGATCG CCGCGGGCGG GATCGCCTCT 
GCCGAACAGG CCTGGGAACG CATTCGCGCG GGAGCAAGCC TGGTGCAGGT CTATTCGGCG 
ATGGTCTTTG AAGGGCCGGG TCTTGCGAGC CGCATCGCAC GCGGGCTGGA GACGCTGGCG 
GCGCGCGACG GGTTTGCGCG GGTGAGCGAC GCGGTGGGGG CGGGCGCCTG A

Protein sequence

MSLFASLTDA AYALARPLVH ATDGEAAHNL TLAALQPLPR ARHALTSPML ATELAGLRFP 
NPVGLAPGFD KDARVAHAMP HFGFGFVEVG TLTPLPQEGN PRPRLFRLVE DRAIINRMGF 
NNGGQVAAAE RIACLRRHGL PVPLGINIGA NKDSADRIAD YAKGTAAMAP LADYLTVNIS 
SPNTPGLRAL QDRGALEALL DGVAAAQPAG AAKPVFLKVA PDLEPADIDD IVAVALDRGL 
AAVIVSNTTV ARPPLASRHA VEAGGLSGAP LAQLALQCVQ DFRAASGGRL PLIAAGGIAS 
AEQAWERIRA GASLVQVYSA MVFEGPGLAS RIARGLETLA ARDGFARVSD AVGAGA