Gene RPB_1168 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_1168
Symbol
ID	3910103
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	+
Start bp	1339235
End bp	1340215
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	65%
IMG OID	637883062
Product	Mg2+ transporter protein, CorA-like
Protein accession	YP_484789
Protein GI	86748293
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0598] Mg2+ and Co2+ transporters
TIGRFAM ID	[TIGR00383] magnesium Mg(2+) and cobalt Co(2+) transport protein (corA)

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.426868
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTTGCGC TTTTTTCCCC CGTCGATTCC GCGCTGAAGC GGGCCGCCTC GGTCGATTTC 
GCCGCGCTGC CCGAGGACAC GGTGTGGATC GACCTCGAGC GGCCGACGCC GGACGAGGAC 
CACGCGGTGG AAAAGCTGGC CGGGATCGCG GTGCCGACGC GCGAGGACAT GCAGGAGATC 
GAGATCTCCA GCCGTCTGTA TATCGAGAAC GGCGCCCGCT ATATGACCGC CAGCTTGATG 
TGCGGCGCCG ACACCACCTC GCCGCGGCTG TCGCCGGTCA CCTTCATCCT GGCCGGCAAG 
CGCCTGGTGA CGGTGCGCTA TGACGAGCCG CGGCCGTTCG CGGTGATCGA GAACCGGCTC 
GCCCGCACCC CGTCCTTCGC CGCCACCGGC GAGACCGTGC TGCTCGAACT GCTCGACGCC 
GTGATCGACC GCTGCGCCGA CATTCTGGAG CGCGCCGGCG CCGACGTCGA CGACGTCAGC 
CGCGAGATCT TCGAGCCCGA GGGCTCGGCC CGCACCGGCC ACCAGAAGCG CTATTCCGAG 
ATCCTGATCG CGATCGGCCG CAAGGGCGAC CTCGTCTCCA AGGTGCGCGA GAGCCTGGTC 
TCGATCGGCC GCCTGGTCGC CTTCCTCACC GTCGAGGGCG AGGGCCTGAA ATGGCCGAAG 
GACAGCCGCA CCCAGCTCAA GACCATGCAG CGCGATGTGA TCTCGCTGAC CGACCACGCC 
AGCTACCTGT CGAACAAGAT CACCTTCGTG CTCGACGCCA TGCTGGGCGT CGTCAATCTC 
GAGCAGAACA ACATCATCAA GCTGTTCTCG GTGATGGCCG TCGTCCTGAT GCCGCCGACC 
CTGATCGCCT CGGTCTACGG CATGAACTTC AAATTCATGC CCGAACTGCA ATGGGCCCAC 
GGCTACACCA TGGCGCTCGG CATGATGCTG ATGGCCGCGG TGCTGCCGTA TATGTTCTTC 
AAGTGGAAGA AGTGGTTGTA G

Protein sequence

MLALFSPVDS ALKRAASVDF AALPEDTVWI DLERPTPDED HAVEKLAGIA VPTREDMQEI 
EISSRLYIEN GARYMTASLM CGADTTSPRL SPVTFILAGK RLVTVRYDEP RPFAVIENRL 
ARTPSFAATG ETVLLELLDA VIDRCADILE RAGADVDDVS REIFEPEGSA RTGHQKRYSE 
ILIAIGRKGD LVSKVRESLV SIGRLVAFLT VEGEGLKWPK DSRTQLKTMQ RDVISLTDHA 
SYLSNKITFV LDAMLGVVNL EQNNIIKLFS VMAVVLMPPT LIASVYGMNF KFMPELQWAH 
GYTMALGMML MAAVLPYMFF KWKKWL