Gene Rsph17025_3177 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3177
Symbol
ID	5085662
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	+
Start bp	38613
End bp	39794
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	67%
IMG OID	640484749
Product	hypothetical protein
Protein accession	YP_001169366
Protein GI	146279208
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0006] Xaa-Pro aminopeptidase
TIGRFAM ID	[TIGR02993] ectoine utilization protein EutD

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.266675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGAAG TCGAGCTGCG GTTCAGCCGC GACGAGTTCG CCCAGCGTCT GGAAAAGACG 
CGACGGGCGA TGGAGGCGAA GGGGGTGGAC CTTCTGATCG TCACCGACCC CAGCAACATG 
AACTGGCTGA CCGGCTATGA CGGCTGGTCC TTCTATGTCC ACCAGTGCGT GATCGTGCCG 
CCCGACGGCG AGCCGATCTG GTATGGCCGC GGGCAGGACG CGAACGGGGC GAAGCTGACC 
GCCTGCCTCG CGCACGGGAA CATCATCGGC TATCCCGACC ACTATGTGCA ATCGACCGAG 
CGGCACCCGA TGGACTACCT GTCGGCGCTG ATGACCGACC GCGGCTGGGG CAGCCTGCGG 
ATCGGCGTCG AGATGGACAA CTACTATTTC TCGGCCGCCG CCTTCGCCAG CCTCACGCGC 
CACCTGCCGA ACGCCCGCTT CATCGACTGC ACCGCGCTGG TGAACTGGCA GCGTGCGGTG 
AAGTCGCCGC AGGAGATCGC CTACATGCGC CGCGCCGCCC GCATCGTCGA GGCGATGCAT 
GCGCGCATCC TCGACAAGGT CGCGGTGGGG ATGCGCAAGT GCGACCTCGT GGCCGAGATT 
TACGACGCGG GCATCCGCGG CGCCGACGGC TTTGGCGGCG ACTATCCCGC GATCGTGCCG 
CTTCTGCCCT CGGGGCGCGA GGCCAGCGCG CCGCACCTGA CCTGGGACGA CCGGCCGATG 
AAGGCGGGCG AGGGCACCTT CTTCGAGATC GCCGGCTGTT ATCACCGCTA TCATGTGCCG 
CTGTCGCGGA CCGTCTTCCT CGGCCAGCCC ACGCAAGCGT TCCTGGATGC CGAGAAGGCG 
ACGCTGGAAG GGATGGAGGC GGGCCTTGCC GCCGCGCGTC CGGGCGCCAC CTGCGAGGAT 
ATCGCCCGCG GCTTCTTCGA CGTGCTGGCG AAATACGGCA TCCTCAAGGA CAATCGCACC 
GGCTATCCGA TCGGCGTGAG CTATCCGCCC GACTGGGGCG AGCGCACCAT GAGCCTGCGC 
CCCGGAGACC GGACCGAGCT TCGCCCCGGC ATGACCTTCC ATTTCATGAC CGGCCTCTGG 
CTCGAGGACA TGGGCCTCGA GATCACCGAG TCGATCCTGA TCACCGAGAC GGGGGTGGAG 
TGCCTTGCCA ATGTCCCGCG CCAGCTGTTC GTGAAGGACT GA

Protein sequence

MTEVELRFSR DEFAQRLEKT RRAMEAKGVD LLIVTDPSNM NWLTGYDGWS FYVHQCVIVP 
PDGEPIWYGR GQDANGAKLT ACLAHGNIIG YPDHYVQSTE RHPMDYLSAL MTDRGWGSLR 
IGVEMDNYYF SAAAFASLTR HLPNARFIDC TALVNWQRAV KSPQEIAYMR RAARIVEAMH 
ARILDKVAVG MRKCDLVAEI YDAGIRGADG FGGDYPAIVP LLPSGREASA PHLTWDDRPM 
KAGEGTFFEI AGCYHRYHVP LSRTVFLGQP TQAFLDAEKA TLEGMEAGLA AARPGATCED 
IARGFFDVLA KYGILKDNRT GYPIGVSYPP DWGERTMSLR PGDRTELRPG MTFHFMTGLW 
LEDMGLEITE SILITETGVE CLANVPRQLF VKD