Gene RPC_0064 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPC_0064
Symbol
ID	3971397
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris BisB18
Kingdom	Bacteria
Replicon accession	NC_007925
Strand	+
Start bp	72627
End bp	74480
Gene Length	1854 bp
Protein Length	617 aa
Translation table	11
GC content	70%
IMG OID	637923180
Product	Sulfate adenylyltransferase, large subunit
Protein accession	YP_529962
Protein GI	90421592
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0529] Adenylylsulfate kinase and related kinases [COG2895] GTPases - Sulfate adenylate transferase subunit 1
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR02034] sulfate adenylyltransferase, large subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGTGCC TCGACCACGC CCACGACACC GAGCTCGCCG CGCCGCTAAA ACATCCCGTC 
GATCGGCCGA CGCTGCGCTT CATCACCTGC GGCAGCGTCG ACGACGGCAA GAGCACGCTG 
GTCGGCCGGC TGCTGTATGA TTCCAAGCTG CTGCTCGACG ACCAGCTCAG CGCGCTGCAC 
GCCGAGAGCA AGAGCGCCGG CACCGCCGGC CAGGATCTCG ATTTCGCGCT GCTGGTAGAC 
GGCCTGCAGG CCGAGCGCGA GCAAGGCATC ACCATCGACG TCGCTTATCG CTTCTTCGCC 
ACGCCGCAGC GCCGCTTCGT GGTCGCCGAC ACCCCGGGGC ACGTGCAATA CACCCGCAAT 
ATGGCGACCG GCGCCTCCAC CGCCGACCTC GCCGTGGTGC TGATCGACGC CCGCAAGGGC 
GTGATCGATC AGACCCGCCG GCACAGCCAC ATCGTCGGAC TGTTCGGCAT CCGCCACGTC 
GTGCTGGCGA TCAACAAGAT GGACCTGGTC GGCTTCGACG CCGCGCGCTT CATCGCCATC 
ACCCACGCCT ATCGCGCGCT CGCCGCCGAA CTCGGCATCA CCAACGTCTG CTACGTGCCG 
GTGGTGGCGC CGGACGGCGA CAACATCTTC ACGCCGAGCG CGCGGATGCC CTGGTACAGC 
GGCCCGACCA TCATGGAGCA TCTCGAAGCG GTGGAGGTCG GCGGCGAGAT CCGCGAACGT 
CCGTTCCGCA TGCCGGTGCA ATGGGTCAAC CGGCCGAACG CCGAGTTCCG CGGCTTCAGC 
GGCCGCATCG CCTCGGGCCG CGTTGCGCGC GGCGACGCGA TCATGGTGCA GCCCTCGGAC 
CGCAGCAGCC ATATCGCGCG GATTGTGACG CCGGCCGGCG AGCGCGACGT CGCGGTGGCC 
GGGCAATCGG TGACGCTGCT GCTCGCCGAC GAGATCGACA TCAGCCGTGG CGACGTGGTG 
AGTTCGGGCG CTGCGGCGAT GGTCTGCGAC CAGCTCGCCG CGCGCCTGGT GTGGTTCGAC 
GACGCCGCGC TGGTGCCCGG CCGCCGCTAT CTGTTGAAGA GCGCGAGGTC CTGCGTCGGC 
GCGGTGATCT CCGCGCTGAA GCATCGCGTC GCGATCGACA GCATGGCGCA GCAGGCCGCG 
ACCACGCTGA ACGCCAACGA GATCGGCGCG GTCGAGCTCT GCCTGGAGCG GCCGCTGGTC 
TGCGAGACCT ATCGCGACGA CCGCGAACTC GGCAGCTTCA TCCTGATCGA TCCGCTCAGT 
CACAAGACCG CGGCGGCCGG CATCATCGAC GGCGCGTCGC GCCGTGCCGC CAACAACAAC 
TGGCCGGCGC AAGATGCCGG CACCGCCGTG CGGGCGCAAA GCAAGCCGCG GCCCTGCGTG 
CTGTGGCTGA CCGGGCGCAG CGGCGGCACC ACATCCATCC TTGCTCATCT GCTTGACAAG 
CGACTGAACG AATTCGGTCG GCACTGCATC CTGCTCGACG GCGACGCGCT GCGCCACGGC 
CTCAACCGCG ATCTCGGCGT CGGCGACGCG GCGCGGATCG AGGGCAGCCG CCGCCTCGCC 
GAGATCGCCA AACTGTTCGT CGATGCCGGA CTGATCGCGC TGGTCAAGCC AATCGCGCCG 
CCGCCATCCG GAACGGCGCT GGCGCGGGCG CTGTTCTCGG CCGGCGAATT CATCGAGATC 
GACGTCGCCG CGCCGGTGCA GGAAACCGCG CGGCGCGATC CGAAGCCGCT GGCGCGCCGG 
ACCCGGGCGG CCGAGCTGCC GAAGCGCGCC GACCTCGTGA TCGACGCCGC CACCCTCGCC 
GAAGCCGGCT GCGACCGCAT CATCGCCTCT CTGCGCGAGC GCGGCTGCGT TTAG

Protein sequence

MLCLDHAHDT ELAAPLKHPV DRPTLRFITC GSVDDGKSTL VGRLLYDSKL LLDDQLSALH 
AESKSAGTAG QDLDFALLVD GLQAEREQGI TIDVAYRFFA TPQRRFVVAD TPGHVQYTRN 
MATGASTADL AVVLIDARKG VIDQTRRHSH IVGLFGIRHV VLAINKMDLV GFDAARFIAI 
THAYRALAAE LGITNVCYVP VVAPDGDNIF TPSARMPWYS GPTIMEHLEA VEVGGEIRER 
PFRMPVQWVN RPNAEFRGFS GRIASGRVAR GDAIMVQPSD RSSHIARIVT PAGERDVAVA 
GQSVTLLLAD EIDISRGDVV SSGAAAMVCD QLAARLVWFD DAALVPGRRY LLKSARSCVG 
AVISALKHRV AIDSMAQQAA TTLNANEIGA VELCLERPLV CETYRDDREL GSFILIDPLS 
HKTAAAGIID GASRRAANNN WPAQDAGTAV RAQSKPRPCV LWLTGRSGGT TSILAHLLDK 
RLNEFGRHCI LLDGDALRHG LNRDLGVGDA ARIEGSRRLA EIAKLFVDAG LIALVKPIAP 
PPSGTALARA LFSAGEFIEI DVAAPVQETA RRDPKPLARR TRAAELPKRA DLVIDAATLA 
EAGCDRIIAS LRERGCV