Gene Rsph17029_2031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2031
Symbol
ID	4897743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	2152400
End bp	2153755
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	66%
IMG OID	640112624
Product	glutamate--ammonia ligase
Protein accession	YP_001043906
Protein GI	126462792
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.794004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGACT GGACCGACAG ACTTCCCGAA GCCGCCCGCG CCTACATCGC AGACCGCCGG 
GTGGACGAAG TGGAGTGCAT CCTCTCCGAC ATCGCGGGCG TGGCGCGCGG CAAGGCCATG 
CCTGCCTTCA AGTTCGGCAA GCAGTCGAGC TTCTTCCTGC CGAACTCGAT CTTCCTGCAG 
ACCATCACCG GCGAATGGGC CGACAATCCC TCGGGCGCCT TCACCGAGCC CGACATGATC 
CTGATCCCGG ACTATTCCAC CGCGACCGCC GCGCCCTGGA CGGCGGATAT CACCTTGCAG 
GTGATCCACG ATGCGGTGGA CCAGCAGGGC CGGCCGGTGC CCGTCTCGCC GCGCAACGTG 
CTGCGGCGGG TGGTCGAGCT TTACAATGCG GAAGGCTGGA CGCCGATCGT GGCGCCGGAG 
ATGGAGTTCT TCCTCGTCGC GCGCAACATC GACCCCAACA TGCCGGTCAT GCCGCCCATG 
GGCCGGACGG GCCGCCGTGC GGCGGCCAAG CAGGCCTATT CCATGTCCGC GGTGGACGAA 
TACGGCAAGG TGATCGACGA CATCTACGAC TTCGCCGAGG CGCAGGGTTT CGAGATCGAC 
GGGATCCTGC AGGAGGGCGG CGCGGGTCAG GTCGAGATCA ACCTCGCTCA TGGCGACCCG 
GTGGCTCTGG CCGACCAGAT CTTCTTCTTC AAGCGGCTGA TCCGCGAGGC CGCGCTGCGC 
CACGACTGTT TCGCGACCTT CATGGCCAAG CCCATCGAGG GCGAGCCGGG CTCGGCCATG 
CACATCCACC ATTCGGTCGT CGACAGCGCG AGCAAGCTCA ACATCTTCTC GGATGCCAAG 
GGCGGCGAAA CCGAGGCCTT CCTCCATTTC ATCGCGGGCA TGCAGACGCA CCTGCCCGCG 
GCGGTCGCAC TGCTTGCGCC CTACGTCAAC AGCTACCGCC GCTACGTCCC GGACTTCGCG 
GCCCCGATCA ACCTCGAATG GGGACGCGAC AACCGAACGA CAGGGCTGCG CGTGCCGATC 
TCGGGGCCCG AGGCGCGGCG GCTCGAGAAC CGGCTGGCCG GGATGGACTG CAACCCCTAC 
CTCGGGCTCG CGGCGTCGCT CGCCTGCGGC TATCTGGGGC TGAAGGAGCG GAAGATGCCG 
CAGCCCGAAT GCACGGGCGA CGCCTACATG TCCGAGACGG ATCTGCCCTA CAACCTCGGC 
GATGCGCTCG ACCTGCTCGA GGAGGACGCG GCCCTGCGCG ACGTGCTGGG GCCCGAGTTC 
TGCGGCGTCT ACGATTCGGT CAAGCGCAAC GAATACAAGG AGTTCCTGCA GGTCATCAGC 
CCGTGGGAGC GCGAGCATCT GCTGCTGAAC GTATGA

Protein sequence

MSDWTDRLPE AARAYIADRR VDEVECILSD IAGVARGKAM PAFKFGKQSS FFLPNSIFLQ 
TITGEWADNP SGAFTEPDMI LIPDYSTATA APWTADITLQ VIHDAVDQQG RPVPVSPRNV 
LRRVVELYNA EGWTPIVAPE MEFFLVARNI DPNMPVMPPM GRTGRRAAAK QAYSMSAVDE 
YGKVIDDIYD FAEAQGFEID GILQEGGAGQ VEINLAHGDP VALADQIFFF KRLIREAALR 
HDCFATFMAK PIEGEPGSAM HIHHSVVDSA SKLNIFSDAK GGETEAFLHF IAGMQTHLPA 
AVALLAPYVN SYRRYVPDFA APINLEWGRD NRTTGLRVPI SGPEARRLEN RLAGMDCNPY 
LGLAASLACG YLGLKERKMP QPECTGDAYM SETDLPYNLG DALDLLEEDA ALRDVLGPEF 
CGVYDSVKRN EYKEFLQVIS PWEREHLLLN V