Gene Rsph17029_2771 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2771
Symbol
ID	4897881
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	2913406
End bp	2914482
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	69%
IMG OID	640113373
Product	cysteine synthase A
Protein accession	YP_001044645
Protein GI	126463531
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0031] Cysteine synthase
TIGRFAM ID	[TIGR01136] cysteine synthases [TIGR01139] cysteine synthase A

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGCTC AGAAGATCCG GACGACCGAG GGCCGCGGCA GGCTCTACGA CAGCGTGCTC 
GACACGGTGG GCAACACGCC CGTCATCCGC ATCAACAACC TCTCGCCCGA AGGCGTGACG 
ATCTACGTCA AGGCCGAGTT CTTCAACCCG GCGGCCTCGG TCAAGGACCG GCTCGCGCTG 
AACATCATCG AGGCGGCGGA ACGGTCGGGC AAGCTCAAGC CCGGCATGAC CGTCGTCGAG 
GCGACCTCGG GCAACACCGG CATCGGGCTC GCCATGGTCT GCGCCCAGAA GGGCTATCCG 
CTGGTCATCA CCATGTCCGA GGCCTTCTCG GTCGAGCGGC GGCGGCTGAT GCGGCTTCTG 
GGCGCGAAGG TCGTCCTGAC CCCGCGCGGC GGCAAGGGCT TCGGCATGTA TCGCAAGGCG 
CAGGAGCTGG CCGAGGCGAA CGGCTGGTTC CTCGCGAGCC AGTTCGAGAC CGACGCCAAT 
GCCGACATCC ACGAGGCCAC CACCGCGCGC GAGATCGTGG CGGATTTCGC GGGCGAGCGG 
CTCGACTGGT TCGTGACCGG CTACGGCACC GGGGGCACGG TCACCGGCGT CGCGCGGGTG 
CTGCGCCGCG AGCGACCGGA GGTGAAGATC GTGCTCTCCG AGCCTGCGAA TGCGCAGCTC 
GTGGCCTCGG GCGTGCCGCA GGACCGCAAC GCCGACGGCA CCGCAGCCTC GGGCCACCCG 
GCCTTCGAGG CGCATCCGAT CCAGGGCTGG ACGCCCGACT TCATCCCGAA GGTGCTTCAG 
GAGGGGCTCG ACGCCGGGGC CTATGACGAG CTGATCCCGG TTGCGGGCGA GGACGGGATG 
AAATGGGCGC GCGAGCTGGC GGCCAAAGAG GGCATCCTCA CCGGCGTCTC GGGCGGCTCG 
ACCTTCGCGG TGGCGCGGCA GGTGGCCGAA CGGGCGCCGA AGGGCTCGGT GATCCTCGCG 
ATGCTGCCCG ACACGGGCGA GCGCTACATG TCGACCCCGC TCTTCCAGGC CATCGGCGAG 
GACATGAACG AGGAGGAGAA GGCGCTCTCG GCCTCGACGC CGAGCTTCCA GCTCTGA

Protein sequence

MDAQKIRTTE GRGRLYDSVL DTVGNTPVIR INNLSPEGVT IYVKAEFFNP AASVKDRLAL 
NIIEAAERSG KLKPGMTVVE ATSGNTGIGL AMVCAQKGYP LVITMSEAFS VERRRLMRLL 
GAKVVLTPRG GKGFGMYRKA QELAEANGWF LASQFETDAN ADIHEATTAR EIVADFAGER 
LDWFVTGYGT GGTVTGVARV LRRERPEVKI VLSEPANAQL VASGVPQDRN ADGTAASGHP 
AFEAHPIQGW TPDFIPKVLQ EGLDAGAYDE LIPVAGEDGM KWARELAAKE GILTGVSGGS 
TFAVARQVAE RAPKGSVILA MLPDTGERYM STPLFQAIGE DMNEEEKALS ASTPSFQL