Gene RPD_1159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPD_1159
Symbol
ID	4021635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB5
Kingdom	Bacteria
Replicon accession	NC_007958
Strand	+
Start bp	1318574
End bp	1319620
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	68%
IMG OID	637961351
Product	sulphate transport system permease protein 1
Protein accession	YP_568298
Protein GI	91975639
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1118] ABC-type sulfate/molybdate transport systems, ATPase component
TIGRFAM ID	[TIGR00968] sulfate ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.940545
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTG AAGTCCGCAA TATCGTCAAG GAATTCGGCA GCTTCCGCGC GCTCGACAAT 
GTCGACCTGC GGGTCGAGAC CGGCGAGCTG ATGGCGCTGC TCGGCCCCAG CGGCTCCGGC 
AAGACCACGC TGCTGCGGAT CATCGCCGGG CTGGAATGGC CCGACGCCGG GTCGATCGCG 
TTCGACGGCG AGGACGCGCT GGCGCGCGGC GCGGCCGAGC GGCATGTCGG CTTCGTGTTC 
CAGCACTACG CGCTGTTCCG GCACATGAGT GTGTTCGAGA ACGTCGCCTT CGGGCTGCGG 
GTGCAGCCGC GCAGGATCCG CAGGAGCGAG GCGGAGATCA GGAAGCGTGT CGGCGATCTG 
CTCGATCTGG TGCAACTCGG CTGGCTGGCC GACCGCTATC CCAACCAGCT CTCAGGTGGC 
CAGCGCCAGC GTATCGCGCT GGCCCGCGCG CTGGCGATCG AGCCGCGCAT CCTGCTGCTC 
GACGAGCCGT TCGGCGCGCT CGACGCCAAG GTCCGCAAGG AGCTGCGCGC CTGGCTGCGC 
AATCTGCACG AGGAGATCCA CGTCACCTCG ATCTTCGTCA CCCACGATCA GGAGGAGGCG 
CTCGAAGTCG CCAACCGGGT GGTAGTGATG GACAAGGGCA AGATCGAACA GATCGGCTCG 
CCGGGCGACG TCTATGAGCG CCCCGCCTCC GCCTTCGTGC ACAGCTTCAT CGGCGAATCC 
ATCGTACTGC CGGTCGAGGT CCGCGACGGG CGGGTTCAAC TCGGCGACCG CGTGCTCGAT 
CTCGCGCCGC CCGAGACCGG GGGCGGTCCG TCGAAGCTGT TCGTTCGCCG CCACGACATC 
GCGGTGGGGC CGAGCGGCAG CGGCGTGTTC GAAGGCGCGG TCAGGTCGGT GCGCGCGTTC 
GGCCCGATGC AGCGCGCCGA TATCCTGCTG CAGGGCGTCG ACGGTGACAT GCTGGTCGAG 
ATCGACGCGC CGCGCGACCA TTCGCTCAAG GTCGGCGACC GGATCGGCCT GCAGCCGCAG 
CGCTACCGGA TCTTCGCTGA TCACTGA

Protein sequence

MTIEVRNIVK EFGSFRALDN VDLRVETGEL MALLGPSGSG KTTLLRIIAG LEWPDAGSIA 
FDGEDALARG AAERHVGFVF QHYALFRHMS VFENVAFGLR VQPRRIRRSE AEIRKRVGDL 
LDLVQLGWLA DRYPNQLSGG QRQRIALARA LAIEPRILLL DEPFGALDAK VRKELRAWLR 
NLHEEIHVTS IFVTHDQEEA LEVANRVVVM DKGKIEQIGS PGDVYERPAS AFVHSFIGES 
IVLPVEVRDG RVQLGDRVLD LAPPETGGGP SKLFVRRHDI AVGPSGSGVF EGAVRSVRAF 
GPMQRADILL QGVDGDMLVE IDAPRDHSLK VGDRIGLQPQ RYRIFADH