Gene Rsph17029_3049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3049
Symbol
ID	4898672
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	60243
End bp	61340
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	74%
IMG OID	640113651
Product	hypothetical protein
Protein accession	YP_001044921
Protein GI	126463808
COG category	[S] Function unknown
COG ID	[COG3395] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0679578
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGGCAG AGAGGGCCCC TGGCGCGGGG TTCCGGTCCG CAGGCGGTCG GCGCGCCTCA 
GGGACGGGGG TGCCCGTGAC GCGGCTTGCC ATCGTTGCGG ACGACCTGAC CGGCGCCCTC 
GACGCCGGCG CGGGCTTTGC GATGCGGGGC GCACGGGTGC GCGTGGCGCG GAGCCTTACC 
GATCTGCCGG AGGCGCTGGC GAGTGGCGCC GAGGTCATCG CGCTCTCGAC CGGCACGCGC 
GACCTCGGGG TTGCCGAGGC GCAGGCACGG CTGGCCGAGG TGCGGGCGCT TCTGGGCGCG 
CAGCCGCTCC TCTTCAAGAA GATCGACAGC CGCCTGAAGG GTCCGATTGC GGCCGAACTG 
GCGGCGCTTC TGGAGGGCGA TCCGCGCCCG ATCCTCGCCA CGCCGGCGAT CCCGGCCCTC 
GGCCGGTTCT GCGAAGCGGG CGCGGTGACG GGGGCGGGCG TGGACCGGCC CATCGCGGTG 
GCCCCGGCCC TCGGACGCCC GGCCCGGGTG ATCGACGCGC GCACCGACGC GGAGATCGAG 
GCGGCGCTGC CCGACGACCT CGCCGCGCAG GTCTTCGTGG GGGCGGCAGG CCTTGCCGCG 
GCGCTGGCCC GCAGGCTCTG GCCTGGTGCG GCGTCGACCC GGACGCATCT TTTGTCGACC 
CCTGCCCTCT TCGCCATCGG GTCGCGCGAT CCGGTGACGC TCGCGCAGAT CGCGGCGCCG 
CACGCGCTGC CGATCCGGGA TGCGCCGAAC GGCGCGGTTC CGGCCCTTCC CGCGACGGAT 
GCGCTCCTCG TGCGGATGAC GCCGGCCGAG CCCGCCTGCC CGGCTGCCGT CGCGGGAGAC 
ACCTTCGCGC GCGGGATCGC GGCTTCCATG GCCGCGCGGC CGGTGGCCAC GCTCTTCGCC 
TGCGGCGGCG AGAGCGCGAA TGCGATCCTG GCCGAGCTCG GGATCGGGCA GCTCGACCTT 
CTGGGCGAGC TTCTCCCCGG CATCCCCGTC TCGGAGGCGC GCCACGCGGG GCGGAGGCTC 
AGGATCGTCA CCAAGTCGGG CGGCTTCGGA CCGCCGGACA CGGTTGTAAA ACTTGTAAAA 
TTCCTGGAGA GGGTCTAA

Protein sequence

MSAERAPGAG FRSAGGRRAS GTGVPVTRLA IVADDLTGAL DAGAGFAMRG ARVRVARSLT 
DLPEALASGA EVIALSTGTR DLGVAEAQAR LAEVRALLGA QPLLFKKIDS RLKGPIAAEL 
AALLEGDPRP ILATPAIPAL GRFCEAGAVT GAGVDRPIAV APALGRPARV IDARTDAEIE 
AALPDDLAAQ VFVGAAGLAA ALARRLWPGA ASTRTHLLST PALFAIGSRD PVTLAQIAAP 
HALPIRDAPN GAVPALPATD ALLVRMTPAE PACPAAVAGD TFARGIAASM AARPVATLFA 
CGGESANAIL AELGIGQLDL LGELLPGIPV SEARHAGRRL RIVTKSGGFG PPDTVVKLVK 
FLERV