Gene Sala_1691 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_1691
Symbol
ID	4081094
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	+
Start bp	1780530
End bp	1782191
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	66%
IMG OID	638010065
Product	urocanate hydratase
Protein accession	YP_616737
Protein GI	103487176
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2987] Urocanate hydratase
TIGRFAM ID	[TIGR01228] urocanate hydratase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCGCC TCGATAACAG CCGCGTGATC CGCCCGGCGA CCGGCCCGGA GATCAGCGCG 
AAAAGCTGGC TTACCGAAGC CCCGATGCGG ATGCTGATGA ACAACCTCCA TCCCGACGTC 
GCCGAAGCGC CGCACGAGCT GGTCGTCTAT GGCGGCATCG GTCGCGCCGC GCGCGACTGG 
GAAAGCTATG ACCGGATCGT CGAGACGCTC AGACGGCTCG AAGGCGACGA GACATTGCTC 
ATCCAGTCGG GCAAGCCCGT GGGCGTATTC CGCACCCACG CGGACGCGCC GCGCGTGCTG 
CTCGCCAATT CGAACCTCGT CCCCCAATGG GCGAATTGGG AGCATTTTCA CGAGCTCGAT 
AAAAAGGGCC TGATGATGTA CGGGCAGATG ACCGCGGGCA GCTGGATCTA TATCGGCAGC 
CAGGGCATCG TGCAGGGAAC CTACGAAACC TTCGTCGAAA TGGGCCGCCA GCATTATGGC 
GGCGACCTTT CGGGTCGCTG GCTGCTGACC GCAGGACTCG GCGGCATGGG CGGCGCGCAG 
CCGCTCGCGG CGGTGATGGC GGGCGCGAGC TGTCTCGCGA TCGAATGCCA GCCGAGCCGC 
ATCGAGATGC GCCTGCGCAC CGGCTATCTC GACAGGCAGG CGGCGAGCAT CGACGAGGCG 
CTGGCGATGA TCGAAGCGAG CCACGCCGAG GACAAGCCGG TCTCGGTCGG CCTGCTCGGC 
AACGCCGCCG AAATCCTGCC GGAGATCGTC CGTCGCGGCA TCCGCCCCGA CCTCCTGACC 
GACCAGACCT CCGCGCACGA TCCGGTGAAT GGCTACCTCC CCGCGGGCTG GAGCCTCGAC 
CAATGGTTTG CGAAGCGCGA GAGCGATCCG TCCGCAGTCG CGAAAGCGGC AAAAGCCTCG 
ATGGCGGTGC ATGTTCGGGC GATGCTCGAC CTGCACGCCG CAGGTGTTCC GACGACCGAT 
TATGGCAATA ATATCCGCCA GATGGCGAAA GACGAGGGTG TCGAAAATGC CTTCGACTTC 
CCCGGCTTCG TTCCCGCCTA TGTCCGCCCG CTCTTCTGTC GCGGTATCGG CCCCTTCCGC 
TGGGTGGCGC TGTCGGGCGA TCCCGAGGAC ATCTACCGGA CCGACGCGAG GGTGAAGCAA 
CTGCTCCCCG ACAACACCCA CCTTCACAAC TGGCTCGACA TGGCGCGCGA ACGCATCCAG 
TTCCAGGGCC TGCCTGCGCG CATCTGCTGG GTCGGGCTCG GCGACCGCCA CCGCCTCGGC 
CTCGCCTTTA ACGAGATGGT CGCGTCGGGC GAATTGAAAG CGCCGATCGT GATCGGCCGC 
GACCATCTCG ATTCGGGCTC GGTCGCCTCG CCCAACCGGG AGACCGAGGC AATGCGCGAT 
GGCAGCGATG CGGTCAGCGA CTGGCCGCTG CTCAATGCGC TCCTCAACAC CGCATCGGGC 
GCGACCTGGG TGTCGCTCCA TCACGGCGGC GGGGTCGGCA TGGGCTATTC GCAGCACAGC 
GGCATGGTGA TCGTCGCCGA CGGCACACCC GAAGCGGCGA AGCGGCTCGA GCGCGTGCTG 
TGGAACGATC CCGGAACCGG GGTCATGCGC CACGCCGACG CGGGGTATGA CATCGCCATC 
GACTGCGCGC GCGAAAAGGG CCTCGACCTG CCAAGCATCT GA

Protein sequence

MTRLDNSRVI RPATGPEISA KSWLTEAPMR MLMNNLHPDV AEAPHELVVY GGIGRAARDW 
ESYDRIVETL RRLEGDETLL IQSGKPVGVF RTHADAPRVL LANSNLVPQW ANWEHFHELD 
KKGLMMYGQM TAGSWIYIGS QGIVQGTYET FVEMGRQHYG GDLSGRWLLT AGLGGMGGAQ 
PLAAVMAGAS CLAIECQPSR IEMRLRTGYL DRQAASIDEA LAMIEASHAE DKPVSVGLLG 
NAAEILPEIV RRGIRPDLLT DQTSAHDPVN GYLPAGWSLD QWFAKRESDP SAVAKAAKAS 
MAVHVRAMLD LHAAGVPTTD YGNNIRQMAK DEGVENAFDF PGFVPAYVRP LFCRGIGPFR 
WVALSGDPED IYRTDARVKQ LLPDNTHLHN WLDMARERIQ FQGLPARICW VGLGDRHRLG 
LAFNEMVASG ELKAPIVIGR DHLDSGSVAS PNRETEAMRD GSDAVSDWPL LNALLNTASG 
ATWVSLHHGG GVGMGYSQHS GMVIVADGTP EAAKRLERVL WNDPGTGVMR HADAGYDIAI 
DCAREKGLDL PSI