Gene RPB_0687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_0687
Symbol
ID	3908193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	771461
End bp	772702
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	65%
IMG OID	637882579
Product	HipA-like protein
Protein accession	YP_484309
Protein GI	86747813
COG category	[R] General function prediction only
COG ID	[COG3550] Uncharacterized protein related to capsule biosynthesis enzymes
TIGRFAM ID	[TIGR03071] HipA N-terminal domain

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTCAGG CTGTCCTCGC GGCCGAGCGA ATCCAGTCAC TCGATATCTC ATTGAACGAC 
CTTCCCGTCG GCACCCTCGT CCGGACGCCG GGTGACTACA ACGCGTTCAA CCTCTTGCCC 
GCTTACCGGG CCATGAACAA TCCGCCGGTC TTCAGCCTGT CGCTTCGCTC AGCGGATGGC 
GGCCTCCGGC GAGATCCCAA GCCCATACGC AGAGCACTGC CTCCGTTCTT TGCGAACCTG 
CTGCCCGAAG AGAAACTGCG CGAAGCGATG GAAAAGCACC ACGCCGCGTC CGTCAGGCCG 
GGCAACGACT TCGATCTTCT GGCCGCGCTG GGCGGCGATC TGCCGGGAGC GGTCCGCGCC 
CTACCGAGTG ACGGCAGCCC CGTCGTGGCC GGCCCGGAAG CCCAAGGCCG CAACACGCGG 
TTCTCTCTCG CCGGTGTGCA AATGAAACTG TCGGTGATGA AGAACACCGG CAAACAAGGC 
GGCATCACGC TCGCGGTCGG CGACGGGCAA GGCCAGTACA TCGCCAAATT TCCCTCGCTC 
ACGCATATCG GACTCTCGGA GAACGAGTTC GCCCTGATGG CCCTGGCGGA AGCGCTGGGC 
ATGGAGGTGC CCGCGCGCGA GCTCGTCGAC AAGACCGAGT TCACCGGCAT CCCCGACGAG 
TTCACCACCC AGTCCACCGG CAAGGTGCTG CTCGTCCGCC GCTTCGACCG CGGCGATGGC 
GACACGCGCG TGCATATCGA AGACTTCGCG CAGGTGTTCG GCCGCTACCC GTCCGAGAAG 
TACAATGGCG GCGCGTATCA CAATATCGGC GCGGCGCTCA CCAGCGGGGT CTCGTTCGAT 
TCGGCCATCG AGTTTGCTCG GCGCCTCGCG CTCGCCGCGA TCACCGGCAA TGGCGACATG 
CATCTGAAGA ACTGGTCGCT GCTCTATCCC GGCGACGGCC GGACGCCGAT GCTGGCGCCG 
GTCTACGACA TGCTCTCGAC GATTCCTTAC CTCCCTAAGG ATGGGCTCGC CCTCAGCCTC 
GCCGGCGAAA AGTCGCTCCA GGCGCTCACG CCGGAGCGCT GGCGCAACTT CGCAAACCGA 
AGCCGTCTTC CGGAGGGCGC CGTGTTAACC GCTGTCGCCG AGACTGCGGC CGCCGTGCGT 
GACAAGTGGC TCGTTCTTCC GGAACGCGAC GTTGTGCCTG CGCAGGTCCG CGCGCGGATC 
GATGCCCACA TCGATGAAAT GGTGCCGCTG CTCGACCCCT GA

Protein sequence

MTQAVLAAER IQSLDISLND LPVGTLVRTP GDYNAFNLLP AYRAMNNPPV FSLSLRSADG 
GLRRDPKPIR RALPPFFANL LPEEKLREAM EKHHAASVRP GNDFDLLAAL GGDLPGAVRA 
LPSDGSPVVA GPEAQGRNTR FSLAGVQMKL SVMKNTGKQG GITLAVGDGQ GQYIAKFPSL 
THIGLSENEF ALMALAEALG MEVPARELVD KTEFTGIPDE FTTQSTGKVL LVRRFDRGDG 
DTRVHIEDFA QVFGRYPSEK YNGGAYHNIG AALTSGVSFD SAIEFARRLA LAAITGNGDM 
HLKNWSLLYP GDGRTPMLAP VYDMLSTIPY LPKDGLALSL AGEKSLQALT PERWRNFANR 
SRLPEGAVLT AVAETAAAVR DKWLVLPERD VVPAQVRARI DAHIDEMVPL LDP