Gene RPB_3374 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RPB_3374
Symbol	cysS
ID	3911176
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris HaA2
Kingdom	Bacteria
Replicon accession	NC_007778
Strand	-
Start bp	3857649
End bp	3859130
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	62%
IMG OID	637885277
Product	cysteinyl-tRNA synthetase
Protein accession	YP_486981
Protein GI	86750485
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0215] Cysteinyl-tRNA synthetase
TIGRFAM ID	[TIGR00435] cysteinyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.301866
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.0269367
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTTGC GCCTCTACGA CACGCTGACC AAAGAGAAGC GCGCCTTCGC GCCGATCGAT 
CCGTCGAACG TGCGGATGTA TGTCTGCGGG CCGACGGTCT ACGACTTCGC CCATATCGGC 
AATGCCCGGC CGGTCATCGT GTTCGACGTG CTGTTCCGGC TGCTGCGGCA TCTCTACGGC 
GAAAACCACG TCACCTACGT CCGCAACATC ACCGACGTCG ACGACAAGAT CAACGACCGC 
GCCGCGCGTG ACTATCCCGG CCTGCCGCTG AACGAGGCGA TCCGCAAGGT CACCGAGCAG 
ACCGAGCGGC AATTCCACGA CGACGTCGAT GCGTTGGGCT GCCTGCGGCC GACCGTCGAG 
CCGCGCGCGA CCGAACACAT CGGCGAGATG CGCACCATCA TCGACCGGCT GGTCGCCGGC 
GGCTTCGCCT ATGTCGCCGC GGACCACGTG CTGTTCTCGC CGGCGGCGAT GAACGCTGCG 
AACAGCGTGC TGCCGCGCTA CGGCGCGCTG GCCAACCGCT CGCTCGACGA GATGATCGCC 
GGCGCCCGCG TCGACGTCGC CCCCTACAAG CGCGACGCCA CCGACTTCGT GCTGTGGAAG 
CCGTCGAAGC CCGGCGAGCC GTCCTGGCCG TCGCCGGCCG GCATCACGAT GGAAGGACGT 
CCCGGCTGGC ACATCGAATG CTCGGCGATG TCGTGGAAGC ATCTCGGCGA GACCTTCGAC 
ATCCACGGCG GCGGCATCGA CCTGGTGTTT CCGCATCACG AAAACGAAGT CGCGCAAAGC 
TGCTGCGCCT TCCAGACCGA CCGCATGGCC CAGACCTGGA TGCACAACGG CTTCCTACAG 
GTCGAAGGCG AGAAGATGTC GAAGAGCCTG GGCAACTTCA TCACGATCAG GGAGTTGCTG 
GCGACGGAGA AATTCGGGGG AGATAGTTGG GTTGGTGAGA TTCTTCGATT TGCGATGATT 
AAAACTCACT ACCGCTCACC GATCGACTGG ACCGTGAAGG CGCTCGACGA GGGTCATAAG 
GTTCTTTGGG ATTGGTATCG CGACATTGGT GACGTCGGGC CGGCACAGCA ACTGCCGGGA 
GAATTCATCG ACTGTTTGGC TGATGATCTC AACATATCGA GTGCCATCGC ATTCATGCAC 
AGCCTGCGTA AAGATAAGAA GTTTGCTGAG CTTCTTGCGA CGATGAACTT TCTTGGATTC 
TCGAATGCGG AATCGGTTTT GGCGCGTCGC CCTGTTGGAG TTCGGATTAA TCTTCCCCCT 
GCGCACGCCG AGGCGGCCGT CGGAACAGTG GAAGTACTCG CAAAGCCCTT GAGCAAGAGC 
GAGATTGAAG AACGGATCGA CGCCCGAACC GCCGCCCGCG CGCGAAAAGA TTTCAAGGAA 
TCCGATCGCA TCCGCGACGA GCTCGCCGCG ATGGGCATCG CGATCAAGGA CGGCAAGGAC 
GCCGACGGCA AGCCGGTGAC GACCTGGGAG ATCGCGCGAT GA

Protein sequence

MALRLYDTLT KEKRAFAPID PSNVRMYVCG PTVYDFAHIG NARPVIVFDV LFRLLRHLYG 
ENHVTYVRNI TDVDDKINDR AARDYPGLPL NEAIRKVTEQ TERQFHDDVD ALGCLRPTVE 
PRATEHIGEM RTIIDRLVAG GFAYVAADHV LFSPAAMNAA NSVLPRYGAL ANRSLDEMIA 
GARVDVAPYK RDATDFVLWK PSKPGEPSWP SPAGITMEGR PGWHIECSAM SWKHLGETFD 
IHGGGIDLVF PHHENEVAQS CCAFQTDRMA QTWMHNGFLQ VEGEKMSKSL GNFITIRELL 
ATEKFGGDSW VGEILRFAMI KTHYRSPIDW TVKALDEGHK VLWDWYRDIG DVGPAQQLPG 
EFIDCLADDL NISSAIAFMH SLRKDKKFAE LLATMNFLGF SNAESVLARR PVGVRINLPP 
AHAEAAVGTV EVLAKPLSKS EIEERIDART AARARKDFKE SDRIRDELAA MGIAIKDGKD 
ADGKPVTTWE IAR