Gene Rsph17025_2048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_2048
Symbol
ID	5082753
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	2091298
End bp	2092365
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	75%
IMG OID	640483610
Product	urea amidolyase related protein
Protein accession	YP_001168244
Protein GI	146278085
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.984998
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.316716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTCG AGATCCTCAC GGCCGGGCCG ATGCTGACGG TGCAGGACGC CGGCCGCTTC 
GGGCTGCGCC ACATGGGCGT GTCGCCGGCG GGCCCCATCG ACCGCGCCGC CATGGCGCTG 
GCCAATGCGC TGGTGGGCAA CGATCCCGGC GCGGCGGCGC TCGAATTTGC CGGGCCCGCG 
GGCCGGTTCC GCTGCGACCG GCCGGTGCGC TTTGCCGTCG CGGGCGCCGA CTGCCCCTTG 
CGCATCGACG CCCGCACCGT TTCCCCCGGC GAGAGCCACC GGCTGAACCC CGGCGAGACG 
CTGACGGTGG GCGTGCCCGA GGGCGCGGTC TGGGCCTATC TCGCCTTCTC GGGCGCCATC 
GCCTCGCCCG AGGTGCTCGG CTCGCGCGCG ACCCATCTGC GCAGCGGCGT CGGGGGCCGC 
GCGCTCGGCG CGGGCGACCG CCTGCCGCTC GGCGAGGACG ACCCGGAGGC CCCCTGCCTG 
CGCCCCGGCC TCCGCCTCGA GGCCGCGGCA CCCTTCCGGG AGACGGGGCC GATCCGGCTG 
ATCCTCGGCC CGCAGGACGA TCATTTCGCG CCCGAGGTGA TCGCCCGCCT CACCGGCTGC 
GACTTCACCG TCACGCCCCA GCGCGACCGG ATGGCGATGG TGCTGGGCGG TGTCGAACTG 
CCGGCCGAGC GGGGGCACGA CATCGTGTCC GACGGCACGG TGCCCGGCTC GGTGCAGGTG 
CCCGGCTCGG GGACGCCGCT CGTCCTGCTG GCGGAAAGCC AGACCACCGG CGGCTATCCC 
AAGATCGGAA CCGTCGCTTC GGTCGATCTG GCGCGGCTTG CGCAGATGCC GGTGGGCGCG 
CGGTTCCGCT TTGCGCTGAT CTCGGCCCGC GAGGGCGAGG ATCTCTGGAT TGCCCGGCAG 
GCGCGCCTGC GCCGCCTGCT CGAAGGGCTG GTGGCCCGGC CCGAGGGCCT CTTGCGCAGC 
GACTACCTCC TGTCCTGCGA CCTCGTCGGC GGCTTTTACG CGCCGGGCGA AGTGGTGCGC 
CCCGTGACGC GGCCCGTGAC GCGGCCCGTG CCGGAGGAGC GCCCATGA

Protein sequence

MSLEILTAGP MLTVQDAGRF GLRHMGVSPA GPIDRAAMAL ANALVGNDPG AAALEFAGPA 
GRFRCDRPVR FAVAGADCPL RIDARTVSPG ESHRLNPGET LTVGVPEGAV WAYLAFSGAI 
ASPEVLGSRA THLRSGVGGR ALGAGDRLPL GEDDPEAPCL RPGLRLEAAA PFRETGPIRL 
ILGPQDDHFA PEVIARLTGC DFTVTPQRDR MAMVLGGVEL PAERGHDIVS DGTVPGSVQV 
PGSGTPLVLL AESQTTGGYP KIGTVASVDL ARLAQMPVGA RFRFALISAR EGEDLWIARQ 
ARLRRLLEGL VARPEGLLRS DYLLSCDLVG GFYAPGEVVR PVTRPVTRPV PEERP