Gene Rsph17029_2474 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_2474
Symbol
ID	4896725
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	2606084
End bp	2607229
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	72%
IMG OID	640113072
Product	aminodeoxychorismate synthase
Protein accession	YP_001044348
Protein GI	126463234
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.139893
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTTCCTGT GCGAGAACGG ACCCCGGTCC GGCCCGGCCC TGTTCCGGGA GCCCGTCGAG 
ACGGTGATCG TGGAGGAGCC CGCGGCGCTG GCGCCCGCGC TTGCGCGCCT CGATGCGCTG 
CGGGCCGAAG GGTTCTGGAT CGCGGGAACG GTGGCCTACG AGGCGGGGCT GGTGTTCGAG 
CCGCGGCTCG CGCGCCTCAT GCCGCCGCAG CGCTCGGAGC CGCTTCTGGC TTTCGGCGCC 
TTCCGCGCGC CGCTGCCCGC GGGCGATCTG CTGGCGCAGG CTGCGGCCGA GGCGGGAGAG 
GTGCGGCTCG CGCCCTTCCG CCCGCGGATC GCCCGCGCCG ACTATGACGC GGCCTTCGGC 
CGGCTCATGG CCTATATCGC GGCGGGCGAC TGCTATCAGG TGAACCTCAC CTTCCCGCTC 
GACGGGCGGC TCGAGGCGGG CAGCGCGCTC GGCCTCTACG GCGCGCTGCG GGCACGCCAG 
CCGGTGGGGC AGGGCGCCTT CTGCGATCTG GGCGGGCCGG TGGCCATCTC GGCCTCGCCG 
GAACTGTTTT TCGACTGCGA CGCCGAGGGG CGGATCTCGA CCCGGCCGAT GAAGGGCACC 
GCGCCCCGCG ATCCCGATCC CGCCCGCGAC GCGGAGCTCG CGAAAATCCT CGGATCGAGC 
GAGAAGGGCC GCGCCGAGAA CCTGATGATC GTCGATCTCC TGCGCAACGA CATCGGCCGG 
ATCGCCGAGC TGGGTTCCGT CCGGGTGCCC GAGCTGTTCG CGATCGAAAG CTATGCCACC 
GTCCATCAGA TGGTGAGCCG GGTGACGGGG CGACTGATCG GATGGCCGGG CCTGTCGGGG 
CTTCTGCCCG CGCTCTTTCC CTGCGGTTCG GTGACAGGCG CGCCCAAGAT CCGGGCGATG 
GAGATCATCG GCGAGCTGGA ACCTTTTCCC CGGGGTCTCT ATTGCGGGGC GATGGGCTGG 
ATGGCGCCGG ACGGGCGCGC GGCCTTCAAT GTGGCGATCC GCACGCTGCG CCTGTTTCCG 
GGCGGGGAGC TGCGGCTCGA TGTGGGCGGC GGCATCGTAC AGGATTCGAC CGCGCCCGGT 
GAATGGGAGG AAGCCTTGTG GAAGACCCGC TTCGCCGAGC TGCCGACGAC CCCGACCTGC 
GGCTGA

Protein sequence

MFLCENGPRS GPALFREPVE TVIVEEPAAL APALARLDAL RAEGFWIAGT VAYEAGLVFE 
PRLARLMPPQ RSEPLLAFGA FRAPLPAGDL LAQAAAEAGE VRLAPFRPRI ARADYDAAFG 
RLMAYIAAGD CYQVNLTFPL DGRLEAGSAL GLYGALRARQ PVGQGAFCDL GGPVAISASP 
ELFFDCDAEG RISTRPMKGT APRDPDPARD AELAKILGSS EKGRAENLMI VDLLRNDIGR 
IAELGSVRVP ELFAIESYAT VHQMVSRVTG RLIGWPGLSG LLPALFPCGS VTGAPKIRAM 
EIIGELEPFP RGLYCGAMGW MAPDGRAAFN VAIRTLRLFP GGELRLDVGG GIVQDSTAPG 
EWEEALWKTR FAELPTTPTC G