Gene RPB_1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1048
Symbol
ID	3908900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1204880
End bp	1205926
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	69%
IMG OID	637882941
Product	sulphate transport system permease protein 1
Protein accession	YP_484669
Protein GI	86748173
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1118] ABC-type sulfate/molybdate transport systems, ATPase component
TIGRFAM ID	[TIGR00968] sulfate ABC transporter, ATP-binding protein

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATTG AAGTCCGCAA CATCGTCAAG CAATTCGGCA GTTTCCGCGC GCTCGACAAT 
GTCGACCTGC GGGTCGAGAC CGGCGAGCTG ATGGCGCTGC TCGGCCCCTC CGGCTCCGGC 
AAGACCACGC TGCTGCGGAT CATCGCCGGG CTGGAATGGC CCGACGCCGG CTCGATCGCG 
TTCGACGGCG AGGACGCGCT GGCGCGCGGC GCCGCCGAGC GCCATGTCGG CTTCGTGTTC 
CAGCACTACG CGCTGTTCCG GCACATGAGC GTGTTCGAGA ACGTCGCCTT CGGTCTGCGG 
GTGCAGCCGC GCAAGATCCG CAAGAGCGAG GCGGAGATCA GAAAGCGCGT CGGCGATCTG 
CTCGATCTGG TGCAGCTCGG CTGGCTCGCC GACCGCTATC CGAACCAGCT CTCCGGCGGC 
CAGCGCCAGC GCATCGCGCT CGCCCGCGCG CTGGCGATCG AGCCGCGCAT CCTGCTGCTC 
GACGAGCCGT TCGGCGCGCT CGACGCCAAG GTGCGCAAGG AACTACGCGC CTGGCTGCGC 
AATCTGCACG AGGAGATCCA CGTCACCTCG ATCTTCGTCA CCCACGATCA GGAAGAGGCG 
CTCGAAGTCG CCAACCGCGT GGTGGTGATG GACAAGGGCC GGATCGAACA GATCGGCTCG 
CCCGGCGACG TCTACGAGCG CCCGGCCTCG GCCTTCGTGC ACGGCTTCAT CGGCGAATCC 
ATCGTGCTGC CGGTCGAGGT GCGCGACGGC CGCGTGCGAT TGGGCGACCG CGTGCTCGAT 
CTGGCGCCGA CCGACACGGC CTCCGGCCCG TCGAAACTGT TCGTCCGCCG CCACGATGTC 
GCGGTCGGCC CCAGCGGCAG CGGCGTGTTC GAGGGCGCGG TCAAGTCGGT GCGCGCGTTC 
GGCCCGATGC AGCGCGCCGA TATCGTGCTG CAAGGCGTCG GCGGCGACAC GCTGGTCGAG 
ATCGACGCGC CGCGCGACCA CTCACTCAAG GTCGGCGACC GCATCGGCCT GCAGCCGCAG 
CGCTACCGGA TTTTCGCCGA TCGCTGA

Protein sequence

MTIEVRNIVK QFGSFRALDN VDLRVETGEL MALLGPSGSG KTTLLRIIAG LEWPDAGSIA 
FDGEDALARG AAERHVGFVF QHYALFRHMS VFENVAFGLR VQPRKIRKSE AEIRKRVGDL 
LDLVQLGWLA DRYPNQLSGG QRQRIALARA LAIEPRILLL DEPFGALDAK VRKELRAWLR 
NLHEEIHVTS IFVTHDQEEA LEVANRVVVM DKGRIEQIGS PGDVYERPAS AFVHGFIGES 
IVLPVEVRDG RVRLGDRVLD LAPTDTASGP SKLFVRRHDV AVGPSGSGVF EGAVKSVRAF 
GPMQRADIVL QGVGGDTLVE IDAPRDHSLK VGDRIGLQPQ RYRIFADR