Gene Rpal_5058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_5058
Symbol
ID	6412752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	5441232
End bp	5442329
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	62%
IMG OID	642714943
Product	basic membrane lipoprotein
Protein accession	YP_001994022
Protein GI	192293417
COG category	[R] General function prediction only
COG ID	[COG1744] Uncharacterized ABC-type transport system, periplasmic component/surface lipoprotein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACAAGG CGATCATGGC GGCGCTGGTG CTGGCGGCCA GCTGCGCGGG GCTGTCGGCG 
GCGACGGCCC AGGACAAGCC GGACAGCAAA CCGGACAAGC TGAAGATCGG CTTCGTCTAT 
GTCGGCCCGG TCGGCGACTT CGGCTGGTCG TATCAGCACG ATCAGGCGCG TCAGGCGATC 
ATCAAGGAAT TCGGCGATCG TGTCGAAACC ACCTTCCTGG AGAAGGTCGG CGAAGGTCCC 
GACGGCGAGC GCTCGATCGA GCAGCTCGCC CGCGCCGGCC ACAAGCTGAT CTTCGCGACC 
TCGTTCGGCT ACATGGATTC GGTGATCAAG GTCGCCAAAA AATATCCGGA CGTGAAATTC 
GAACACGCCA CCGGTTACAA GCGCGAGCCG AACGTCTCGA CCTATGCGGG ACGGTTCTAC 
GAAGGCCGCA CCATCCAGGG CACGATCGCC GCGAAGGTCT CGAAGAAGGG CGTGCTGGGC 
TATATCGGCT CGTTCCCGGT GCCCGAGGTG ATCTCCGGTA TCAATGCCAC CATGCTGGCG 
GCGCAGAAGA TCAATCCGAA CATCAAGATC AAGATCGTCT GGGTGAACTC CTGGTTCAAT 
CCCGGCAAAG AAGCCGACGC TGCCAAAGCG CTGATCGATC AGGGCGCCGA CGTGATCATG 
CAGCATACCG ACAGCGCCGC GGCGATGCAG ATCGCCAACG AGCGCGGCAT TCACGCGTTC 
GGCCAGGACT CCGACATGAT CAAGTTCGGA CCGAAGGCCC AGCTCACCGC CATCGTCAAC 
AACTGGACGC CGTACTACGT GTCGCGCGTC AAAGCGGTGA TGGACGGCAA TTGGGCATCG 
CAGGATGTCT GGGAAGGCCT GAAGGACAAG ATGATCCAGA TGGCGCCCTA CACCAACATG 
CCCGACGACG TGAAGAAACT CGCCGCCGAC ACCGAGGCCG GCATCGCCGC CGGCACCATC 
AAGCCGTTTG CCTGCCCGAT CGTCGACCAG GAGGGCAAGG AGGTCGAGTG CAAAGGCGGC 
GACCAGCTCG ACGACGGCCA GATCCGCGGC ATGAATTTCT ACGTCAAAGG CATCGACGAC 
AAGATCCCGG GGAAGTGA

Protein sequence

MNKAIMAALV LAASCAGLSA ATAQDKPDSK PDKLKIGFVY VGPVGDFGWS YQHDQARQAI 
IKEFGDRVET TFLEKVGEGP DGERSIEQLA RAGHKLIFAT SFGYMDSVIK VAKKYPDVKF 
EHATGYKREP NVSTYAGRFY EGRTIQGTIA AKVSKKGVLG YIGSFPVPEV ISGINATMLA 
AQKINPNIKI KIVWVNSWFN PGKEADAAKA LIDQGADVIM QHTDSAAAMQ IANERGIHAF 
GQDSDMIKFG PKAQLTAIVN NWTPYYVSRV KAVMDGNWAS QDVWEGLKDK MIQMAPYTNM 
PDDVKKLAAD TEAGIAAGTI KPFACPIVDQ EGKEVECKGG DQLDDGQIRG MNFYVKGIDD 
KIPGK