Gene Sala_0923 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sala_0923
Symbol
ID	4083133
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sphingopyxis alaskensis RB2256
Kingdom	Bacteria
Replicon accession	NC_008048
Strand	-
Start bp	936265
End bp	937488
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	69%
IMG OID	638009284
Product	amidohydrolase
Protein accession	YP_615974
Protein GI	103486413
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.671663
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATTGA GGCCGCTCCA TATCGCCAAC GCGCTGCTGG TCGATGGCGA TACGCCGCGT 
CCGGGCAGCC TGCTGGCGGT CGACGGCCGC ATCGCCGCGA TCGACCCGGC TGACATCCCC 
GAAGGCGCCG AAACCGTCGA TGCCAGGGGT CAGTGGCTCG CGCCGGGAAT CATCGACCTT 
GGCGTCTTTG CGACCGACAA GCCCGCCTTT CACTTCGGCG GCATCACGCG CGCCGCGCTG 
ATGCCCGACA ATGGTCCGCT CGACGGCGTC GGCCTTGTCG AGCGCGCGGC GAAGGGCGGC 
AAACCCGACC TCTGGGTCCA TCCCCTCGCG GCCGCGACCA AGGGCCTCGA GGGCCGCGAG 
CTCGCGGAAA TCGGCCTGAT GAAACAGGCG GGTGCGCGTG CCGTTGCCAC CGGCCGCGCC 
CGCGTCGCCG ACAGCGGAGT GATGCGCCGC GTGCTCGCCT ATGCCGCCTC GTTGGGGCTC 
GTGACGATCA TCCATGCCGA GGATGAAGGG CTGACCGCCG GCGCCGTCGC AACCGACGGC 
GAGATGGCGA CGCGGCTTGG CCTGTCGTCG GCGCCCGCGA TCGCCGAAGC GATGGCGATC 
GCGCGCGACC TGTCGCTCGT CGAGGAAACC GGCGCGCCGG TGCATTTCCG CCAGGTCACG 
ACCGCGCGCG GGCTCGACCT GATCCGCGCC GCCAAGGCAA AGGGACTGCC CGTGCTTTGC 
GGCATCACCC CCGCGCATCT GTTCCTGTCG GATACGGCAA TCGGCGATTT CCGGACCTTT 
GCGCGGCTTT CACCGCCGCT GCGCAGCGAA GACGATCGCC GTGCCTGCCT TGCGGCGGTC 
GTCGACGGCA CGATCGACGT TCTGTCTTCA GGCCACGACC CGCGCGGCCC CGAGGACAAG 
CGCCTGCCAT TTGCCGAAGC ACTGCCCGGC ATGGCGGGAG CCGAAACCTT GCTCGCCATG 
GGCCTGAACC TCGTCCGCGA CGGACATATC ACGCCTGGCC GTCTGTTCGA GATGCTTGCC 
GCCATCCCAG CCTGCCTGCT CGGTGTCGAC GCGGGCCGCC TTGTAGCGGG CGGGGAAGCC 
GACCTCATCC TCGTCGACCC CGACATCCCG TGGCAGGTCG ATGCAAAGAA GATGGCGACC 
TGGGCGGGCA ACACTCCATT CGACGGCATG CCTGTCCAGG GCCGCGCCAC CATGATGTGG 
AAGGGCGGAA AGCGGATCCG CTGA

Protein sequence

MELRPLHIAN ALLVDGDTPR PGSLLAVDGR IAAIDPADIP EGAETVDARG QWLAPGIIDL 
GVFATDKPAF HFGGITRAAL MPDNGPLDGV GLVERAAKGG KPDLWVHPLA AATKGLEGRE 
LAEIGLMKQA GARAVATGRA RVADSGVMRR VLAYAASLGL VTIIHAEDEG LTAGAVATDG 
EMATRLGLSS APAIAEAMAI ARDLSLVEET GAPVHFRQVT TARGLDLIRA AKAKGLPVLC 
GITPAHLFLS DTAIGDFRTF ARLSPPLRSE DDRRACLAAV VDGTIDVLSS GHDPRGPEDK 
RLPFAEALPG MAGAETLLAM GLNLVRDGHI TPGRLFEMLA AIPACLLGVD AGRLVAGGEA 
DLILVDPDIP WQVDAKKMAT WAGNTPFDGM PVQGRATMMW KGGKRIR