Gene RSP_3449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_3449
Symbol
ID	3721735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007494
Strand	-
Start bp	519194
End bp	520258
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	74%
IMG OID	640073116
Product	putative allophanate hydrolase subunit 2
Protein accession	YP_354954
Protein GI	77465451
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCTCG AGATCCTGAC CGCAGGTCCC ATGCTGACCG TGCAGGACGC GGGCCGCTTC 
GGCCTGCGCC ACATGGGCGT CTCGCCCGCG GGCCCCATCG ACCGGGCCGC CATGGCGCTC 
GCCAATGCGC TCGTGGGCAA TGCGCCCGGC GCCGCGGCGC TGGAATTCGC AGGCCCTGCG 
GGCAGCTTCC GCTGCGACCG GCCGGTGCGC TTTGCGGTGG CCGGGGCCGA CTGCCCGATC 
CGCATCGACA AGCGCGTGGT GCTGGCGGGC GAGAGCCACC GGCTGAACCC CGGTGAAACC 
CTCACCGTGG GCGTGCCCGA AGGCACGGTC TGGGCCTATC TGGCCTTCTC CGGCGCCATC 
GCCACGCCCG AGGTGCTGGG CTCGCGCGCG ACGCATCTCC GCTCGGGCCT CGGCGGCCCC 
GAGGGGCGGG CGCTGGCGGC GGGCGACCGG CTGCCGCTCG GCCCCGACGA GGCCGACGCG 
CCCTGCCTGC GCCCCGACAG CCGTCTGGAC GGCGCGGCGC CCTTCCGCGA GACGGGACCG 
ATCCGGCTGA TCCTCGGCCC GCAGGACGGC CATTTCGCCC CCGAGATCGT GGCGCGCCTC 
ACCGGGTGCG ACTTCACCGT GACCCCGCAG CGCGACCGGA TGGCCATGGT GCTGGGCGGC 
ACCGACCTGC CCGCCGCGCG CGGGCACGAC ATCGTCTCCG ACGGCACGGT GCCGGGCTCG 
GTGCAGGTGC CGGGCTCGGG GATGCCGCTC GTGCTTCTGG CCGAGAGCCA GACCACCGGC 
GGCTATCCCA AGATCGGGAC CGTGGCCTCG GTCGATCTCG CGCGGCTCGC GCAGATGCCG 
GTGGGCGCGC AGGTCCGCTT CGCGCCGATC TCGGCCGAGG AGGGCGAGGA TCTCTGGATC 
GCGCGGCAGG TGCGGCTAAG GCGGCTTCTC GAGGCGCTGG TGGCCAAGCC CGAGGGCGTC 
CTGCGGTCGG ATTACCTCTT GTCCTGCGAT CTCGTCGGCG GCTTCTACGA GCCGGGCGAG 
ATTGTGCGTC CCGTCACGAT TCGGGGCCCG GAGGAATGTT CATGA

Protein sequence

MSLEILTAGP MLTVQDAGRF GLRHMGVSPA GPIDRAAMAL ANALVGNAPG AAALEFAGPA 
GSFRCDRPVR FAVAGADCPI RIDKRVVLAG ESHRLNPGET LTVGVPEGTV WAYLAFSGAI 
ATPEVLGSRA THLRSGLGGP EGRALAAGDR LPLGPDEADA PCLRPDSRLD GAAPFRETGP 
IRLILGPQDG HFAPEIVARL TGCDFTVTPQ RDRMAMVLGG TDLPAARGHD IVSDGTVPGS 
VQVPGSGMPL VLLAESQTTG GYPKIGTVAS VDLARLAQMP VGAQVRFAPI SAEEGEDLWI 
ARQVRLRRLL EALVAKPEGV LRSDYLLSCD LVGGFYEPGE IVRPVTIRGP EECS