Gene RPB_4597 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_4597
Symbol
ID	3912414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	5191304
End bp	5192674
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	65%
IMG OID	637886501
Product	glutamate--cysteine ligase
Protein accession	YP_488191
Protein GI	86751695
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG3572] Gamma-glutamylcysteine synthetase
TIGRFAM ID	[TIGR01436] glutamate--cysteine ligase, plant type

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.4332
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGTG ACCAGATCGA TATGACGCCG CTGAACTCGC GCGACGAACT GGTCGCGTGG 
ATCGAAGCGG GCGTCAAACC GCCGTCGGAA TTCCGCATCG GCACCGAACA CGAGAAGACG 
CCGTTCACGC TCGAGGGCCA TCACCCGGTA CCTTACGACG GCGCGCGCGG CATCGGCGCG 
CTGCTCGAGG GCATGAAGAT CCTGCTCGGC TGGGAACCGA TCATGGAAGG CCCGCACATC 
ATCGGGCTGC ACGACGTCAC CGGCGGCGGC GCGATTTCGC TCGAGCCCGG CGGACAGTTC 
GAATTGTCCG GCGCGCCGGT CGACAATGTG CACCAGACCC ATTCCGAGCT GATGGCGCAT 
CTGGCGCAGG TGCGCGAGAT CGCAGCCCCG CTCGGCATCG GCTTCCTCGG CCTCGGCATG 
ACGCCGTCGT GGTCGCGCGA CGACATTCCG GTGATGCCGA AGGGCCGCTA CAAGATCATG 
ACCAACTACA TGCCGAAGGT CGGCCGCTAC GGCCTCGACA TGATGTATCG GACCTGCACG 
GTGCAGACCA ATTTGGACTT CTCGTCCGAA GCCGACATGG TCAAGAAGCT GCGGGTTTCG 
GTGGCGCTGC AGCCGGTCGC GACCGCTCTG TTCGCCAACT CGCCGTTCAC CGAAGGCAAG 
CCGAACGGCT TCTTGTCGTT CCGTTCCGAA ATCTGGCGCG ACACCGACAA CGCCCGCTCC 
GGCATGATCC CGTGGGCGTT CGAGGACGGC ATGGGGTTCG AGCGCTGGGT CGACTACGCG 
CTCGACGTGC CGATGTATTT CGTCAAGCGC GGCGATGATT ACATCGACGT CTCCGGCTCG 
TCGTTCCGCG ATTTCTTCGA CGGCCGAAAC GACAAGATGC CGGGCGAGCG ACCGACGCTG 
TCGGACTGGG CCAACCATCT GTCGACGATC TTCCCCGAAG TGCGGCTGAA GCGTTACCTC 
GAAATGCGTG GCGCCGACGG CGTGCCGTGG GGCCGGCTGC CGGCGTTGCC GGCGTTCTGG 
GTCGGCCTCT TGTACGACGA CCAGAGCCTC GACGCCGCCT GGGAGATCGT CAAAGGCTGG 
GACGCCTGGG AGCGGCAGGC GCTGCGCGAC GACGTCCCCC GGCTCGGCTT CAAGGCCAAG 
ATCCGCAACC GATTTCTGTT CGAGATCGCC AAGGAATGCC TGGTGCTGGC CCATGCGGGC 
CTGAGGCGCC GCGGCCGGAT CGATTCGTTC GGCAACGACG AATCGCGGTA TCTCGCGCCG 
CTCGAGGACA TCCTCGCCTC CGGCCGCACC CCGGCCGAAG AGATGCTGGA GAAATTCAAC 
GGCGCCTGGC AGGGCTCGGT GGAGCCGGCC TACGACGAAT ACGCGTTCTG A

Protein sequence

MARDQIDMTP LNSRDELVAW IEAGVKPPSE FRIGTEHEKT PFTLEGHHPV PYDGARGIGA 
LLEGMKILLG WEPIMEGPHI IGLHDVTGGG AISLEPGGQF ELSGAPVDNV HQTHSELMAH 
LAQVREIAAP LGIGFLGLGM TPSWSRDDIP VMPKGRYKIM TNYMPKVGRY GLDMMYRTCT 
VQTNLDFSSE ADMVKKLRVS VALQPVATAL FANSPFTEGK PNGFLSFRSE IWRDTDNARS 
GMIPWAFEDG MGFERWVDYA LDVPMYFVKR GDDYIDVSGS SFRDFFDGRN DKMPGERPTL 
SDWANHLSTI FPEVRLKRYL EMRGADGVPW GRLPALPAFW VGLLYDDQSL DAAWEIVKGW 
DAWERQALRD DVPRLGFKAK IRNRFLFEIA KECLVLAHAG LRRRGRIDSF GNDESRYLAP 
LEDILASGRT PAEEMLEKFN GAWQGSVEPA YDEYAF