Gene Rpal_2356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_2356
Symbol
ID	6410018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	2544333
End bp	2545331
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	68%
IMG OID	642712236
Product	ApbE family lipoprotein
Protein accession	YP_001991346
Protein GI	192290741
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCAAT CTACTCTCAC CCGACGGCGT TTCGTCACGA TCGTTGCCAG TGCGTTTGGC 
GTCGCGATGC TCGGCCGCGT GGTGCCGTCG CGCGCGAGCG AGCCGGTGCG CTGGCGCGGC 
GCGGCGCTCG GCGCGCAGGT GTCGATCGAG ATCCACCATC CTGATCGCGT CGCCGCCGAG 
AGGCTGGTGG AGAGGGGCGT GCGCGAGGTA CGCCGGCTCG AGCAGATGTT CAGCCTGTAT 
CGGCCGGACT CGGCGATCTG CGCGCTCAAC CGGTCAGGTG TGCTGATCGC GCCGGACCGC 
GATGTGGTGG CGCTACTGCA GACGACGTTA GACTTCGCCG CGCAAACCGG CGGCGTATTC 
GATCCCACCG TGCAGCCTCT GTGGCAGCTG TATCGACGCC ACTTCGAGCA GGCCGGGGCG 
GATCCGTCCG GTCCAGCGAA GGCAGACGTC GCAGGTGCGC TGGCGAAGGT CGGATACGAT 
GGCGTGCTGG TGTCAGCCGA TCGGATCGCG CTGAAACGAC CGGGCGCCGC GATCACGCTC 
AATGGTATCG CCCAGGGCTT CGCCACCGAT CGCGTGGTCG ATCTGCTGCG CAAGGGCGGG 
ATGACCAGCA CCCTGGTCGA CATCGGTGAG ATCCGTGCGA TCGGTGCCCG GCCGGACGGC 
GTGCCGTGGC GGGTCGGACT GGCCGATCCG GAAACGACGA GTGCCAACCT CGGCACCGTC 
GATCTGGTTG ACCGCGCGGT TGCGACGTCC TCTGGCGCCG GCTTCCGGTT CGATCCGGCC 
GGGCAGTTCA CGCATCTGTT CGATCCCTCG ACCGGACGCA GCCCGGCGCT GTATCGTTCG 
GTCAGTGTCG TCGCGCCCAC CGCGACCGAG GCCGATGCGC TGTCGACCGC GTTCAGCGTG 
CTGGAGCGTG GCCGCATCGA TGCGATCGTT CAGGCGAGGG CAGGCGTCGA GGTGTTGCTC 
GCCGATGCTG AGGGAGGCGT GCAGTGGCTG CGCGGGTAG

Protein sequence

MSQSTLTRRR FVTIVASAFG VAMLGRVVPS RASEPVRWRG AALGAQVSIE IHHPDRVAAE 
RLVERGVREV RRLEQMFSLY RPDSAICALN RSGVLIAPDR DVVALLQTTL DFAAQTGGVF 
DPTVQPLWQL YRRHFEQAGA DPSGPAKADV AGALAKVGYD GVLVSADRIA LKRPGAAITL 
NGIAQGFATD RVVDLLRKGG MTSTLVDIGE IRAIGARPDG VPWRVGLADP ETTSANLGTV 
DLVDRAVATS SGAGFRFDPA GQFTHLFDPS TGRSPALYRS VSVVAPTATE ADALSTAFSV 
LERGRIDAIV QARAGVEVLL ADAEGGVQWL RG