Gene Rsph17029_0104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0104
Symbol
ID	4895967
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	119408
End bp	120682
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	70%
IMG OID	640110687
Product	allantoate amidohydrolase
Protein accession	YP_001041996
Protein GI	126460882
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0189735
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAGA CCCAGAGCCT TTCCCGCATC GACGCGGATC TTCTGAACGC GCTTATGGAG 
AAAGTGTCCG AGTTCGGCTC GACCGGCGAC GGCGGCATCG ACCGCCCGGC GCTGACCGAC 
GCCCACCGGG ACGCGCGCGA CTGGTTCCGG TCCGAACTCG AGGCGCGCGG CTATACCGTG 
CTCGTCGACG AGATCGGCAA TCTCTTCGGG CGGATCGATC TGGCGGGGCC CGGGGCGCCG 
CTGGTGATGA TCGGCTCGCA TCTCGACAGC CAGCCCCGGG GCGGGCGGTT CGACGGCGCC 
TATGGGGTGA TCGCCGCGCT CGCCGCCATC GAGACCTTCC GCCGCGACGG CGGCACGCCG 
CGCTGCAACT ATGTCATCGC CGACTGGATG AACGAGGAGG GGGCGCGGTT CCAGCCGAGC 
CTCCTCGGCT CGTCGGTCTT CGCGGGCCTC ATCGAGCTCG ACTGGGCGCT GGGGCGGCGC 
GACCGTGACG GGCGGAGCGT GGGCGAGGAA CTGGTCCGCA CCGGCTACAA GGGCACCGAC 
GCGGCGCCGC GCCCGGATCT CTATCTCGAA CTCCATATCG AGGGCGACGC CAAGATGGAG 
ACGGCGGGCG CCCGGATCGC CCCGTTCCTG CGGCACTGGG GCGCGCTGAA GGTCCGGATC 
GAGGTCACGG GCGAGCAGAA CCATACCGGC CCCACGCCGA TGGAAGACCG CAAGGATGCG 
GTTCTGGGCG CGGCCTATAT CATCGCCGAG GTGCGGCGGC TGGCGGATGT GGCCGAGGAT 
ACGCTCTTCA CCTCGGTGGC GCGGGTCGAC ATCTCGCCCA ATTCGCCCAA CATCGTCCCG 
GGCAAGGCGG TCCTGTTCTG CGAGCTCCGC GCGCCCGAAC CGGCGATGCT CGACTGGTCG 
GAGGCAAGCC TCCGCGCGGC CCTGCCGGAG CTTGCCGCCA AGGCCGCCAC CCGTGCCGAG 
ATCGTCTCGA TCGACCGCCG ACCGGCCGGG AAGTTCGACC CGCGCCTCGC CCGGCTGACC 
GAACGCGTGG CAGACGACTT CGGCCTGCCC CGGATGCAGC TCGACACGAT CGGCGGCCAT 
GACGCGGTGG CGCTGAACGC GATCCTGCCG AGCATCGTCT TCGCCGTGCC GTCGGTCGGT 
GGCGTGATCC ACCGCAACGA CGAATATACC AGCCCCGAGG ATCTGGCGGC GGGCGGCGAC 
GTGCTGACCG ACATGGTCCG CCGCATCGAC CGCGCGGGCG CCGATCTCGA CCTCGCGCTC 
GGGGCGAATG CATGA

Protein sequence

MSETQSLSRI DADLLNALME KVSEFGSTGD GGIDRPALTD AHRDARDWFR SELEARGYTV 
LVDEIGNLFG RIDLAGPGAP LVMIGSHLDS QPRGGRFDGA YGVIAALAAI ETFRRDGGTP 
RCNYVIADWM NEEGARFQPS LLGSSVFAGL IELDWALGRR DRDGRSVGEE LVRTGYKGTD 
AAPRPDLYLE LHIEGDAKME TAGARIAPFL RHWGALKVRI EVTGEQNHTG PTPMEDRKDA 
VLGAAYIIAE VRRLADVAED TLFTSVARVD ISPNSPNIVP GKAVLFCELR APEPAMLDWS 
EASLRAALPE LAAKAATRAE IVSIDRRPAG KFDPRLARLT ERVADDFGLP RMQLDTIGGH 
DAVALNAILP SIVFAVPSVG GVIHRNDEYT SPEDLAAGGD VLTDMVRRID RAGADLDLAL 
GANA