Gene Rsph17029_3089 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3089
Symbol
ID	4898190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	104202
End bp	105386
Gene Length	1185 bp
Protein Length	394 aa
Translation table	11
GC content	74%
IMG OID	640113691
Product	creatinase
Protein accession	YP_001044961
Protein GI	126463848
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.430642
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.871573
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGACAC TCCCGGCAGA CACCGCGGCC GACCCGCTCC GCGGCCGTGA CGCGGTTTTC 
CCGGCCGCCG AATTCGCAGG CCGTATGGCG CGGCTGCAGG CGGCCACGGC GGATCTCGGC 
GCCGATGCGC TGGTGCTGCT CGGGCCCGAG AACATCTTCT GGGCCACGGG GCGGCAGACG 
GCGGGCTATT TCGCCTTTCA GGCCCTCGTG GTGCCGGTCG AGGGGGCGCC CGTGCTCCTC 
GTGCGCCAGC TCGAGACGAC GGGCGCGCGT GCTTCGACCT GGCTCGCCGA CATCCGCGCC 
TGGCAGGACG GCGAGGACCC CGCGGCGGCG CTCGGCGCCC TCGTGCGGGA TCTGGGCCTC 
GGGCGCATCG CCATGGAGCG CGGCGCCTGG TTCATCGGTC AGGACCTGTC CGAGCGCATC 
GCCCAGGCCC TTGCCGGCGT GGCGCTGATC GACGGGTCGG GTGTGGCGGA GCGGCTGCGC 
GCGGTGAAAT CGCCGGCCGA GCTGTCCGCG ATCCGCAAGG CCGCGGGCTA TGCCGAGGCC 
GCCATCGCCG CCTCGATCGA GGCCTGCCGG GCGGGCGTCA GCGAGAACGA GGTGGCCGCC 
GCCATGATGG GGGCCGCGAT CCGCGCGGGC TCCGAAGCCA TGGCGATGGA GCCGCTCGTC 
TCCTCGGGGC CGCGCTCGGG CGTGCCCCAT GCGACCTGGC GGCGACGGCT GCTCGAACCC 
GGCGACGGGG TGTTCCTCGA ACTGGCGGCG AGCCACGACC GCTATCACGC GGCGCTCATG 
CGCAGCGTCT GGATCGGCCC GCCGCCCGCC GAGGCCGCGC GCATGATGGA CACGGCCGAG 
CGCGCGCTCG ATGCGGCGCT GGCGGCCCTG CGCCCCGGCG CGCCCTGCGC GGCGCCGCAC 
GAGGCCGCGC AGGCGGTGAT CGATGCCGCG GGCTATACGG CCGCCTTCCG CAAGCGCATC 
GGCTATTCGA TGGGCGCGGC CTTCGCGCCC GACTGGGGCG AGGGGGCGAT CCTGTCGCTC 
TTCACCGGCG TGGATCGCCT GCTGGAGCCC GGCATGGTCT TCCACCTGCC CGCCACGCTG 
CGCAGCTACG GCGACTATAC GGTCGGCGCC TCCGAGACGG TGATCCTCAC CGAAACCGGC 
ATCGAGGTCT TGTCGACCCT GCCCAGACAG ATGAGGGTGC GCTGA

Protein sequence

MSTLPADTAA DPLRGRDAVF PAAEFAGRMA RLQAATADLG ADALVLLGPE NIFWATGRQT 
AGYFAFQALV VPVEGAPVLL VRQLETTGAR ASTWLADIRA WQDGEDPAAA LGALVRDLGL 
GRIAMERGAW FIGQDLSERI AQALAGVALI DGSGVAERLR AVKSPAELSA IRKAAGYAEA 
AIAASIEACR AGVSENEVAA AMMGAAIRAG SEAMAMEPLV SSGPRSGVPH ATWRRRLLEP 
GDGVFLELAA SHDRYHAALM RSVWIGPPPA EAARMMDTAE RALDAALAAL RPGAPCAAPH 
EAAQAVIDAA GYTAAFRKRI GYSMGAAFAP DWGEGAILSL FTGVDRLLEP GMVFHLPATL 
RSYGDYTVGA SETVILTETG IEVLSTLPRQ MRVR