Gene Rsph17025_4218 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_4218
Symbol
ID	5086389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009430
Strand	-
Start bp	261003
End bp	262226
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	67%
IMG OID	640485779
Product	HipA domain-containing protein
Protein accession	YP_001170373
Protein GI	146280216
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0466] ATP-dependent Lon protease, bacterial type
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.234705
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0892557
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCTCTTT TCGACGACGA TCTCGATGAA ACCGGGAGTG CCGAAGAGCT TCCCCCGACG 
CCAGCCGGCT TCCGGCGCGA GTGGGCGCAG CTGCGGGACA TGGACGCCTC GATGCATCAC 
AATGAGGCGC AGAGGTGGTC GTTCCTGAAG CGGCCGTCCA GTCTCGAGAC CTACAGCTTC 
CTTTTCAAGC GCGCCTGCGG GGAGCCTCAT GAGGTCGTCA GGAGACGGCT GCGTGAACTG 
CAGAATGCCG ATCCGCTGTG GGTGGGCCTC GCCTCCGAGG TACGCGCGCG GCTCATGCTG 
CAGGCCGGCG ATCTTTCGCA AGGAGAGGGG GATTGCGGAA CCGCATCCGC CGAGGTCACG 
AACGGCAGCG TGCCGGCGGG CCATATCCTG TTGCATGCCG CTCCGGCAAA AGTCGGGGAG 
GACCGGCGCG GCCGGGACGC CCTGCGAGAG GCGCTGGCCA AGCCCAAGAG GCTTGCTGGA 
CCGAGAACGC CGGACGAGGT GGACAGGCTC TTTGCCGCCC TCTTTGCGGA AGGCCCCTGG 
CTCCGGAAGC CGCTCGCATG GGCCTGGCAG AGGGCGCTCG ACAGTCTCGA TGAATGTGGA 
TGGTTTCGCC TGCCGCCGCT GTTGCTGCTC GGACCTCCCG GCTGCGGCAA GACCCGGATG 
GCCGAGCGGC TGGCCGAATT GGCGGGCCTG CCCCGGTCGC GTCTGGAGGG CGCCAGCATG 
ACGGCGAGCT TTCCGATCGG GGGGAGTGAT TTCCAGTGGA ATTCCTCCCA TCCGGGTGAG 
GCTGTGAGGC TCATCCACGA GAGCGACGTG GCAAATCCGC TCGTGATCTT CGATGAGGTC 
GAAAAGGGGC AGACGAGTTC CTCCGGCGGC GATCCTCGCC AGGCCCTCCT GCCTTTTCTG 
CAGCGCTCCA CCGCGGCAAG CTACCGTTGC CCCTACCTGC AGGCGCCTGT CGATCTCAGC 
CACGTCACCT GGATCCTCAC GGCCAACAGC CTCGAGGGGC TCAGCGCGCC GCTTCTCGAC 
CGCGTGACAC TCTTTCCCGT GGGCTATCCC ACGGGCTCCG ATCTCGAGCG CCTCGTCATC 
CGCGTGCTGG ACGGGCTGGA GGTGGACGAG CGCGTGGTGG CGCGGCTCAC GGCCGAGATC 
GAGAACGGGC GGCTGACGCT CCGCGGGCTC GATCGTCTGA AAAACGATTT CCGGGCGCTC 
GGGCGCCGGC CGATGCTGCA TTGA

Protein sequence

MPLFDDDLDE TGSAEELPPT PAGFRREWAQ LRDMDASMHH NEAQRWSFLK RPSSLETYSF 
LFKRACGEPH EVVRRRLREL QNADPLWVGL ASEVRARLML QAGDLSQGEG DCGTASAEVT 
NGSVPAGHIL LHAAPAKVGE DRRGRDALRE ALAKPKRLAG PRTPDEVDRL FAALFAEGPW 
LRKPLAWAWQ RALDSLDECG WFRLPPLLLL GPPGCGKTRM AERLAELAGL PRSRLEGASM 
TASFPIGGSD FQWNSSHPGE AVRLIHESDV ANPLVIFDEV EKGQTSSSGG DPRQALLPFL 
QRSTAASYRC PYLQAPVDLS HVTWILTANS LEGLSAPLLD RVTLFPVGYP TGSDLERLVI 
RVLDGLEVDE RVVARLTAEI ENGRLTLRGL DRLKNDFRAL GRRPMLH