Gene Rsph17025_4280 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_4280
Symbol
ID	5086458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009431
Strand	-
Start bp	40917
End bp	42437
Gene Length	1521 bp
Protein Length	506 aa
Translation table	11
GC content	74%
IMG OID	640485838
Product	hypothetical protein
Protein accession	YP_001170432
Protein GI	146280276
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG0547] Anthranilate phosphoribosyltransferase [COG0583] Transcriptional regulator
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	33
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGAGA ACGATTCCAA ATTCAGCTTT GCGGAACCCG ACGCGTGCGG AGCGTCGAAT 
GGCCGGCCGG AGCCGCTTCT GCCCGTGGCC CCGCTGGCGC GGCTGCGGCT TCTGGTGGCG 
CTGGATGCGC TTCTGGCCAC AGGCAGCGTC TCGGGGGCGG CCAAGGCGCT GGGGATCTCG 
CCTCCGGCCG CGAGCCGGAT GCTGGCGCAG CTGCGGCGCC TCTTCGACGA CGAGTTGCTG 
GTCCGTTCCG GCCGCGGAAT GGTGCCGACG GCCCTCGCGG GCCGGCTGCG GATGCGGGTG 
CGGGGGCTGG CCGCCGAGGC GGACGCGCTG ATGCGGGGCG AGCCGGCCCC GGCCGATCCG 
CCCCCGCCCC ATCCGCCGCT GGCCCTCGAG AGGGGGGCGC GGCTGGACGG GCAGCCGGAC 
GAGTGCGGTC GTCTGCGTCG CCTGTTCGAG ATCGGCCCCA CCCATCCGCC GCAACACCGG 
CTGGCGCGTC ATGTGGCGAT GGTCGGGGCG GGCCGCAGCC GCGCGCGCCC GCTGGATCTG 
TCCGAAGCCG AGGATGCCTT CGCGATCCTG CTGGATGGCG AGGCCGATCC GGTGCAGGTC 
GGGGCCCTTC TGGTGGCGCT GCAGTATCGC GGCATCACGC CCGACGAACT GGCGGGCCTC 
GTGCGTGCGG CGCGGCGGCA CCTGCGGCCC CTGACGGACG CGGGACCCGT CGATCTGGAC 
TGGCCCGCCT ATCTGTCGCC GCGCAACCGG CGCACGCCCT GGTTCCTGCC CGCGGCGCGC 
CTGCTGGGGG AGGCGGGGCA CCGCGTCCTG CTGCATGGCT TCGGACCGCA ACTGTCGCCC 
CTCGATCCGG TGCTGGAGGC GCTCGGCATT CCCGTCGCCG GTTCGGTCGC GGAGGCGGAG 
GCGTGCCTCT CAAGTCCGGG ATGCGTGTTC CTGCCCCTGC CGGCGATCCT GCCGCAGCTT 
CAGGCCCTGG TGAACCTCTA CCGGGTGCTC CAGATGCGCT CGCCGGTCAA CCTGTCGCTG 
CAGTTGCTGA ATCCGCTGGC GGCGCCCGCG ACGGTGATGG GGCTTCCGGG GGCGTCGCTC 
GCCACGCTGC ACCGCGAGGC GGCGGGACTT CTGGGCTGGA ACCGGCTGCT CTGCATCGAC 
AGCCATCGCG ACGTGGCGCA GGCCACGCCG CACCGCCTGA TGGGCCTGGC CCTGAGCGAG 
CGGGCGGAGG TGTCATGGCT CTCGGCCCCC GCCCGCCTTG CCGAACGGTG CGCCTCGCCG 
CCTCCGGGCC TCACCAGCGC GGAACATTGC AGGGCGGTCT GGAACGGTCA GTCCCGCGAT 
CCTGCGGCGA TCGCCGCGAT CGTCGATACG GCCGCCCTGG GCCTGCTTGC CACAGGAGCC 
GCGCCCTACG ATCTGGCCGA GGCGCGGCGG CTGGCCCGGG ACCTCTGGGA CCGGCGCACG 
ATCGCAGGAC CGCGGGCCGA CACCGTCGCC GCGCGCGCGG TTCCGGGCCG ACGCCCGCGC 
GCCTGTCGCG GAACCGCCTG A

Protein sequence

MFENDSKFSF AEPDACGASN GRPEPLLPVA PLARLRLLVA LDALLATGSV SGAAKALGIS 
PPAASRMLAQ LRRLFDDELL VRSGRGMVPT ALAGRLRMRV RGLAAEADAL MRGEPAPADP 
PPPHPPLALE RGARLDGQPD ECGRLRRLFE IGPTHPPQHR LARHVAMVGA GRSRARPLDL 
SEAEDAFAIL LDGEADPVQV GALLVALQYR GITPDELAGL VRAARRHLRP LTDAGPVDLD 
WPAYLSPRNR RTPWFLPAAR LLGEAGHRVL LHGFGPQLSP LDPVLEALGI PVAGSVAEAE 
ACLSSPGCVF LPLPAILPQL QALVNLYRVL QMRSPVNLSL QLLNPLAAPA TVMGLPGASL 
ATLHREAAGL LGWNRLLCID SHRDVAQATP HRLMGLALSE RAEVSWLSAP ARLAERCASP 
PPGLTSAEHC RAVWNGQSRD PAAIAAIVDT AALGLLATGA APYDLAEARR LARDLWDRRT 
IAGPRADTVA ARAVPGRRPR ACRGTA