Gene RPC_3050 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_3050
Symbol
ID	3973368
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	3379614
End bp	3380651
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	59%
IMG OID	637926160
Product	hypothetical protein
Protein accession	YP_532913
Protein GI	90424543
COG category	[S] Function unknown
COG ID	[COG2253] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.818716
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATAAGG TCGCCCTACT CTCATCGAAG GATCGTGCCG CGCTGTTCGG TGAAACCGGC 
GCGGCTCGCG GTGTGGCGGA TACGATCATC GAGAAGGACT TCTGGGTTTG CTGGACCCTG 
AAGCGGCTCT TCGCACTGCA GGGCGAGGAG TTCGCCAGCC TTGTTTTCAA GGGTGGCACC 
TCCCTGTCTA AGGCCTATGG CGCCATCCGC CGCTTCTCGG AAGACATCGA CCTGTCCCTC 
GACCGCGCAG ATCTTGGATA CGCAGGGGAC CGCGATCCTG AAAAAGAAGG GCTCAGCAAG 
AAAAAGACGG CTCAGCTCAT CGACGACCTA GTGGCCGACG TCGAAAATCA CATCGCGGAG 
AAGCTGCTCC CCGCGTTACG GCGCACGATC ATAGACCAAC TCGGCGAGCC GAAGGATGCC 
GAATGGCGGC TGGAGATCGA TCCCAACGAT GCCCAGACGG TCAATTTCCG CTACCCAGCC 
GCGCTTGAGG CAACTCACTA TGCCGGAATG GCTTACATCA CTCCGAGGGT GAGGCTAGAA 
CTCGGTGCGC GCGGCGATCC GTGGCCGACC GAACAAAAGA TCATTCGCCC CTATGCGGCA 
GAGGACTTCC CCGACTTTTT CGAAGCCCCC GACATCAACG TCGTCGTGCT GTCCGCGCTG 
CGCACCTTCT GGGAAAAGGC GACGGCGCTA CACGCCGAGG CACATCGGCC GAGTGAGACG 
CCGACGCCAC AGTATTTCTC GCGGCACTAT TACGATCTCG CGATGCTGCT TGGCACTGAT 
GAAGGAAAGG CCGCCGCCAC AGACTTTGAC CTCTTGGCGC AGGTCGCTAA GCACAAGGCG 
ACTTTCTTCC GCTCCGGTTG GGCGAGCTAC GAGACCGCCA AGCCGGGGAG CCTTCGCTTG 
ATGCCGGACG AAGCCCGCAT CAAGGATCTT CGCGCCGACT ACAGACAGAT GGCGCCGATG 
ATGTTTGACG ATCGGCCGCC ATCGTTCGAC GACATAATTG CGAAAATCGA GAAACTTCAA 
GAATCCATCA ATAAGTAG

Protein sequence

MDKVALLSSK DRAALFGETG AARGVADTII EKDFWVCWTL KRLFALQGEE FASLVFKGGT 
SLSKAYGAIR RFSEDIDLSL DRADLGYAGD RDPEKEGLSK KKTAQLIDDL VADVENHIAE 
KLLPALRRTI IDQLGEPKDA EWRLEIDPND AQTVNFRYPA ALEATHYAGM AYITPRVRLE 
LGARGDPWPT EQKIIRPYAA EDFPDFFEAP DINVVVLSAL RTFWEKATAL HAEAHRPSET 
PTPQYFSRHY YDLAMLLGTD EGKAAATDFD LLAQVAKHKA TFFRSGWASY ETAKPGSLRL 
MPDEARIKDL RADYRQMAPM MFDDRPPSFD DIIAKIEKLQ ESINK