Gene RSP_4059 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RSP_4059
Symbol	hipA
ID	3711930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides 2.4.1
Kingdom	Bacteria
Replicon accession	NC_007489
Strand	+
Start bp	12163
End bp	13518
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	64%
IMG OID	640069409
Product	hypothetical protein
Protein accession	YP_345276
Protein GI	77404703
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGGATGG ACGTCTGGAT GGAAGGGAGA GATACGCCCG TGGGCGTGCT GACCCGCTCG 
GAAGACAAGA GTCTGTCGTT CGTCTACGCC GGCGACATCG CGCCCGAGCA CCGGATCTCG 
ATGTCGTTGC CGATCACCTC GGAGCCATAC AGCGATGCCG ATTGCAGGGG CTATTTCGCG 
AACCTCCTGT TCGAGGGGCC GCAACTCGAA CGGGTTCTCG ATGGCTTCGG TCTCGACCGT 
GGCGACATCG GTGCGCTCCT GTGGCACCTC GGGGCAGACT GCCCGGGCGC CATCTCGATC 
ACCCCCGAGG GCACGGGGCC CGGCAAGATG CCAGGAAGGT TCCCCGAGGA CTACGAACGG 
CTTTCGGAGG CCCGGCTCCA TCAGATCGTC CTGTCGCTGC ATCGGCACCG CCGCATGCCC 
GAGGGAGAGC GCAACCCGTC ACCCGTCGCG GGCGTTCAGG GCAAGATCGC CTGCCTCATG 
CTCGAGGGGG CGGTCTGGCT GCCCAAGGGC GGCTCCCGCG CACCAACAAC ACATATTCTG 
AAAGTGTCTC CGCACTTCGA TCCTGACGTC ACACGCCAGG AGACGATCTT GCTCCAGATT 
GCCTCCGAGA TCGGGATCGA TGCCGCCGAG ACTCGGGATC TCGTCTTCGA TGTTGGGGGC 
ACGCACATCA ACGCGCTCCT GTCGACGCGC TTCGACCGCG ATATCGAGAT CGCAGAGGGG 
GCAGGAACAA TTCGTCGCCG ACACGCCGAG GACTTCTGCC AGGCGCTCGG TCTGCCACCG 
AGCCTGAAAT ACGAGCGCGA TGCAGTGGAT CCGCATCGCC GTTTCTCGGC CGCCGCCGTG 
AATGTCATCG CGGCACAGAC GACGGTGCCG GCCCTGGTGA CGAGGGATTT TCTGGCACAA 
ACGATCTTCA ACCTGCTCGT GGGCAACACG GACAACCACG GCAAGAACAC GTCGCTTCTC 
TACCGCGGAC GGACGGTCCT CCTGGCGCCG CTTTACGATG TGGCGCCGGT GTTCATGGAC 
AGGCGCGTGA CGCACGAATT CGCCTTCAGG CATGGCAGCG CGCGCTTCGC CGAGGACTTC 
GATGTCGATG CCCTGCGAGG GCTGCTGTCC GATCTCGGCT TCGGAAAGCC GCCCGTCGAG 
CGGGCGATGA AGCAGATCCA GCAGCTTGCG AAAAGGATAT CCGAGCTCTC GGCCCGCCAC 
GCCCCCAAGG GCCTTGTCGA TGGTCTCCAT GCCCAGGCGC GCGTGCTCGA GGATGCGCTC 
GATGTCGACT TCGGTCTTGA AGAACGAGAT TACTACGACC GCGTCGTCAG AGATGAGGCG 
ATCGAGGCAG CGGGTGGATG GGGTACGTTA AGCTGA

Protein sequence

MRMDVWMEGR DTPVGVLTRS EDKSLSFVYA GDIAPEHRIS MSLPITSEPY SDADCRGYFA 
NLLFEGPQLE RVLDGFGLDR GDIGALLWHL GADCPGAISI TPEGTGPGKM PGRFPEDYER 
LSEARLHQIV LSLHRHRRMP EGERNPSPVA GVQGKIACLM LEGAVWLPKG GSRAPTTHIL 
KVSPHFDPDV TRQETILLQI ASEIGIDAAE TRDLVFDVGG THINALLSTR FDRDIEIAEG 
AGTIRRRHAE DFCQALGLPP SLKYERDAVD PHRRFSAAAV NVIAAQTTVP ALVTRDFLAQ 
TIFNLLVGNT DNHGKNTSLL YRGRTVLLAP LYDVAPVFMD RRVTHEFAFR HGSARFAEDF 
DVDALRGLLS DLGFGKPPVE RAMKQIQQLA KRISELSARH APKGLVDGLH AQARVLEDAL 
DVDFGLEERD YYDRVVRDEA IEAAGGWGTL S