Gene Rsph17029_1127 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1127
Symbol
ID	4895303
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	+
Start bp	1172056
End bp	1173234
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	71%
IMG OID	640111713
Product	aminodeoxychorismate lyase
Protein accession	YP_001043009
Protein GI	126461895
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.66542
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGCGCT CCGTCGCCTC CAACGCGCTG ACCCTCTTCA TCGTGGTGCT GGTGGCGGCG 
GCGGGGTTGC TGGCCTGGGG ACGGCAGGAA TATACCGGCC CCGGCCCGCT CGCCGAGGCG 
GTCTGCCTGC GGGTGGAGCG GGGCGACTCG CTCTCGGTCG TGAGCCGCAG GCTCGAAGAG 
CAGGGCGCGG TCAGCGATGC GCGGATCTTC CGCATCGGCG CGGATTATTC CGATCAGGCC 
GCGGGGCTCA AGTTCGGCAG CTACCTGCTG CCGCCCCGCG CCTCGATGGG GGAGATCCTC 
GATATCCTGA CCGCGGGCGG CCAGTCGACC TGCGGGCGCG AGGTGAACTA CCGGATCGGG 
GTGGTGGCGG CCGAGATCAT CCTGCGCGAG TTCGACGCGG CCGCCGGCCG CTATGTCGAA 
GTGGCGAAAT TCGTGCCCGG CGAGGGCGAG GCGCCCGAGG CCTATGCGGA GGCGGCCGAG 
GAGGGCGACC TGCGCTGGCG CGTGACGCTC GCCGAAGGGG TGACGAGCTG GCAGGTGGTC 
GAGAGCCTGC GCAGGGCCGA GTTCCTTCAG GGCGAGATCA AGGAGGTTCC CCCCGAAGGA 
TCGCTCGCCC CCGACAGCTA CGAGGTGGCC CGCGGCGACG ACCGGGCGGC GCTTCTGGCG 
CAGATGCAGG ACCGGCAGGC CCGCATCATC GCCGAGCTCT GGGCCGCGCG TTCGGCGGAT 
GTGCCCTATG CCACGCCGGA AGAGGCGATG GTCATGGCGA GCATCGTCGA GAAGGAGACC 
GGCATCGCGA GCGAGCGGCC GCAGGTGGCG AGCGTCTTCG TCAACCGCCT GGCCCAGGGG 
ATGCGGCTGC AGACCGACCC CACGGTGATC TACGGCCTGA CCGAGGGCAA GGGCGTGCTC 
GGGCGCGGCC TGCGCCAGAG CGAGCTGCGC CGGCGGACGG ATTACAACAC CTATGTGATC 
GACGGGCTGC CGCCCACGCC CATCGCCAAT CCGGGGCGGC TGTCGATCGA GGCGGCGCTC 
AATCCGGCCG AGACCGACTA TCTCTATTTC GTGGCCGATG GCAGCGGCGG GCACGCCTTC 
GCCACCACGC TGGCCGAGCA CAACCGCAAC GTGGCCGCCT GGCGCAAGAT CGAGGCCGAG 
CGGGGGATGC CGCCGCCGGT GGGCATCCAG GGCGAGTGA

Protein sequence

MWRSVASNAL TLFIVVLVAA AGLLAWGRQE YTGPGPLAEA VCLRVERGDS LSVVSRRLEE 
QGAVSDARIF RIGADYSDQA AGLKFGSYLL PPRASMGEIL DILTAGGQST CGREVNYRIG 
VVAAEIILRE FDAAAGRYVE VAKFVPGEGE APEAYAEAAE EGDLRWRVTL AEGVTSWQVV 
ESLRRAEFLQ GEIKEVPPEG SLAPDSYEVA RGDDRAALLA QMQDRQARII AELWAARSAD 
VPYATPEEAM VMASIVEKET GIASERPQVA SVFVNRLAQG MRLQTDPTVI YGLTEGKGVL 
GRGLRQSELR RRTDYNTYVI DGLPPTPIAN PGRLSIEAAL NPAETDYLYF VADGSGGHAF 
ATTLAEHNRN VAAWRKIEAE RGMPPPVGIQ GE