Gene Rsph17025_0955 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_0955
Symbol
ID	5085022
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	976682
End bp	977959
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	69%
IMG OID	640482512
Product	cytosine deaminase
Protein accession	YP_001167161
Protein GI	146277002
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.366628
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0736723
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGATC TGATCGTCAA GGGGGGCACG CTGCCCGACG GGCGCGTGGC CGATGTGGGC 
ATCCGGGGCG ACCGGATCGC CGCCATCGGG GCGCTCGAGG CCGAGGCCGG ACGGGTGATC 
GAGGCCGCGG GCGATCTGGT GAGCCCGGCC TTCGTCGATC CCCATTTCCA CATGGATGCG 
ACGCTCTCCT ATGGGCTGCC GCGCGTGAAT GCGAGCGGGA CGCTTCTGGA GGGGATCGGG 
CTCTGGGGCG AGCTGAAGGA GATCGTGACC GTCGAGGCCA TGGTCGAGCG GGCGCTGGCC 
TATTGCGACT GGGCGGCGAG CATGGGTCTC CTGGCCGTGC GGACCCATGT CGATGTCTGC 
GACGACCGGC TGCTGGGTGT CGAGGCGATG CTGGCGGTGC GCGAAAAGGT CAAGGGCTGG 
ATGGACCTGC AACTCGTGGC CTTTCCGCAG GACGGGCTCT ACCGCGACCC GACGGCGCGG 
GCGAACCTCT TGCGCGCGCT CGACATGGGC GTGGATGTCG TGGGCGGCAT CCCGCATTTC 
GAGCGGACGA TGGCGGACGG CGCGGCCTCG GTGCGTGACC TCTGCGAGAT CGCGGCGGAC 
CGTGGCCTTC CGATCGATTT CCATTGCGAC GAGACCGACG ATCCGCTCAG CCGCCACATC 
GAGACCTATG CCGCCGAGGT GCTGCGCACG GGCCTTCAGG GCCGGGCGGC GGCGGGGCAT 
CTGACCTCGA TGCACTCGAT GGACAATTAC TATGTCTCCA AGCTCCTGCC GCTGATCGCC 
GAGGCCGGGA TCGCGGCGAT CCCGAACCCG CTCATCAACA TCGTGCTGCA GGGCCGCCAC 
GACAGCTTCC CCAAGCGGCG CGGCCTGACG CGGGTCAAGG AGATGCAGGC CTTGGGCATC 
ACCGTCGGCT GGGGGCAGGA TTGCGTCCTC GACCCGTGGT ATTCGCTGGG CACGGCCGAC 
ATGCTCGACG TGGCCTTCAT GGGGCTGCAT GTGGCGCAGA TGACCCATCC CGACGAGATG 
CGGCGCTGTT TCGACATGGT GACGGGCGAG AATGCGAAGA TCATGGGCCT CGACTACGGG 
CTGAGGGAAG GGGCGGTGGC CTCGCTCGTG GTGCTCGATG CCGGCAACCC GGTCGAGGCG 
CTGCGGCTCC GGCCCGACCG GCTCTGCGTG ATCGCCAAGG GGCAGGTCGT CTCGGAGAAG 
GCGCGCAACG ACGCGCGCCT TGGCCTGCCG GGCCGTCCCG CGACGGTGCG CCGCCGCCAC 
GCGCTGCCGC CGCGCTGA

Protein sequence

MFDLIVKGGT LPDGRVADVG IRGDRIAAIG ALEAEAGRVI EAAGDLVSPA FVDPHFHMDA 
TLSYGLPRVN ASGTLLEGIG LWGELKEIVT VEAMVERALA YCDWAASMGL LAVRTHVDVC 
DDRLLGVEAM LAVREKVKGW MDLQLVAFPQ DGLYRDPTAR ANLLRALDMG VDVVGGIPHF 
ERTMADGAAS VRDLCEIAAD RGLPIDFHCD ETDDPLSRHI ETYAAEVLRT GLQGRAAAGH 
LTSMHSMDNY YVSKLLPLIA EAGIAAIPNP LINIVLQGRH DSFPKRRGLT RVKEMQALGI 
TVGWGQDCVL DPWYSLGTAD MLDVAFMGLH VAQMTHPDEM RRCFDMVTGE NAKIMGLDYG 
LREGAVASLV VLDAGNPVEA LRLRPDRLCV IAKGQVVSEK ARNDARLGLP GRPATVRRRH 
ALPPR