Gene Rsph17025_1072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1072
Symbol
ID	5083364
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	1100499
End bp	1101677
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	70%
IMG OID	640482630
Product	aminodeoxychorismate lyase
Protein accession	YP_001167278
Protein GI	146277119
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.232656
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTGGCGCT CTGTCGCCTC CAACGCGCTC ACCCTGTTCA TCGTGGTGCT GGTGGCGGCG 
GCAGGGTTGC TGGCCTGGGG GCGGCAGGAA TACATCGGCC CCGGGCCGCT GACCGAGGCC 
GTCTGCCTGC GGGTCGAGCG GGGAGACTCG CTGTCGGTCG TGAGCCGGCG GCTCGAGTCG 
CAGGGCGCGG TGAGCGATGC GCGCATCTTC CGCATCGGGG CGGACTATTC CGACAAGGCC 
GCGGGGCTCA AGTTCGGCAG CTATCTGCTG CCGCCGGGCG CCTCGATGGC CCAGATCCTC 
GACATTCTGA CGGCGGGCGG GCAATCGACC TGCGGGCGCG AGGTGAATTA CCGGATCGGC 
GTGGTGGCGG CCGAGATCAT CCTGCGGGAG TTCGACGCGG GCGAGGGCCG CTATGTCGAG 
GTGGCGAAGT TCGTGCCGGG GGAGGGTGAG GCGCCCGAAG CCTACCGGGA GGCGGCCGGG 
GAAGGCGACC TGCGCTGGCG TGTGACGCTG GCGGAGGGCG TGACGAGCTG GCAGGTGGTC 
GAGAGCCTGC GCAAGGCCGA GTTCCTCGAG GGCGAGATCA GGGAGGTTCC GCCGGAGGGT 
TCGCTGGCCC CGGACAGTTA CGAGGTGGCG CGAGGGGATG ACCGGGCGGC GCTTCTGGCG 
CAGATGCAGG AGCGGCAGGC GCGCATCATG GCCGAGCTGT GGGCCGCGCG GTCCCCGAGC 
GTGCCCTATG GATCGCCGGA AGAGGCGATG ATCATGGCGA GCATCGTCGA GAAGGAGACC 
GGCATTTCCT CGGAGCGGCC GCAGGTGGCG AGCGTCTTCG TCAACAGGCT GGCGCAGGGG 
ATGCGGCTGC AGACGGACCC GACGGTGATC TATGGCATCA CCGAGGGCAA GGGCGTCCTC 
GGCCGCGGTC TGAGGCAGAG CGAGCTGCGC CGCCGCACCG ACTACAATAC CTATGTGATC 
GACGGGCTGC CGCCCACCCC CATTGCCAAT CCGGGCCGGC TGTCGATCGA GGCGGCGCTG 
AACCCGGCCG AGACGGATTA CCTTTATTTC GTGGCCGATG GCAGCGGGGG CCATGCCTTC 
GCGCGGACCC TGGCCGAGCA CAACCGCAAT GTGGCTGCCT GGCGGCGGAT CGAGGCCGAG 
CGCGGGATGC CGCCCCCGGT GGGGATCCAG GGCGAGTGA

Protein sequence

MWRSVASNAL TLFIVVLVAA AGLLAWGRQE YIGPGPLTEA VCLRVERGDS LSVVSRRLES 
QGAVSDARIF RIGADYSDKA AGLKFGSYLL PPGASMAQIL DILTAGGQST CGREVNYRIG 
VVAAEIILRE FDAGEGRYVE VAKFVPGEGE APEAYREAAG EGDLRWRVTL AEGVTSWQVV 
ESLRKAEFLE GEIREVPPEG SLAPDSYEVA RGDDRAALLA QMQERQARIM AELWAARSPS 
VPYGSPEEAM IMASIVEKET GISSERPQVA SVFVNRLAQG MRLQTDPTVI YGITEGKGVL 
GRGLRQSELR RRTDYNTYVI DGLPPTPIAN PGRLSIEAAL NPAETDYLYF VADGSGGHAF 
ARTLAEHNRN VAAWRRIEAE RGMPPPVGIQ GE