Gene Rsph17029_3578 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3578
Symbol
ID	4898388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	668586
End bp	669671
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	69%
IMG OID	640114187
Product	hypothetical protein
Protein accession	YP_001045441
Protein GI	126464328
COG category	[S] Function unknown
COG ID	[COG3181] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0579989
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTTTA TGACCAAACC GCTGCGTGCA GCCCTGCTGT GCGCCGTCGC TGTCCTGACC 
GCCCCGAGCG CCCTGACCGC GCAGGATTTC GCGGGTGAGA CCGTCGAATG GACGATCCCG 
TTCGGCGTGG GCGGCGGCAC CGACGTCTGG GCGCGCTTTT TCGCGCCGCA GCTGTCGCAG 
GCCCTGCCGG GTCAGCCGAA TGTCGTGGTG CTGAACGTGC CCGGCGGCGG CTCGATCACC 
GGCGCGAACC AGTTCGCCGC CCGTGCGAGC ACCGACGGTC TGTCGATCCT CGGCACCTCG 
GCCTCGACCC AGTATCCGGC GATCCTCGGC GATCCGCGCG TGCGCTACGA CTATGCCAAC 
TGGACGGCGG TGCTGGCCTC GCCCACGGGG GGCGTGGTCT ATGCCGATCC GAAATACGGC 
GTGACCGGGC CCGAGGGCCT CGAGACGCTG CGCGGGCAGG AGATCCGCTT TGCGAGCCAG 
GGCGCGACGG CGCTCGAGAT GCCGGTGCTG CTGGCGCTGA AGATGATGGG GCTGAACATC 
CGCCCGGTCT TCGGCATGGA AAGCCGCGGC GCGGGCCGGC TGGCCTTCGA GCGCGGCGAG 
GCGGGGATCG ATTTCCAGAC GAGCTCGGCC TATCTGGCGA GCGTCAAGCC GCTGGTCGAC 
AGCGGCAAGG CCGTGCCGCT CTTCTCGATG GGCGTGGTGG ATGCCGAAGG CAATGTGGCG 
CGCGACCCGT CCTTCCCGGA CCTGCCGACC TTCGTCGAAT TCTTCACCGA AGCGACCGGC 
GCCGCCCCTG AGGGCGAGGC GTTCGAGGCC TGGAAGGCCC TCATGATCGC GGGCTATTCC 
CTTCAGAAGA TGGTCGTCCT GCCGAAGGAA GCGCCGCCCG AGGTGATCGC GGCCTATTCC 
GAGGCCGCGC GCAAGATCGT CGAGGCGCCG GACTTCCGCG AGCGCGCGGG CGAAGAGATC 
GGCGTCTATG AGCAGCTCGT GGGCGAGGCG GCCGATGCCG CGCTGAAGAA GGCGCTGACC 
GTCGATCCGG CGATCCGCAC CTTCCTGACC ACCTGGCTGT CCGAGGATTA CGGCGTCCGC 
TTCTGA

Protein sequence

MTFMTKPLRA ALLCAVAVLT APSALTAQDF AGETVEWTIP FGVGGGTDVW ARFFAPQLSQ 
ALPGQPNVVV LNVPGGGSIT GANQFAARAS TDGLSILGTS ASTQYPAILG DPRVRYDYAN 
WTAVLASPTG GVVYADPKYG VTGPEGLETL RGQEIRFASQ GATALEMPVL LALKMMGLNI 
RPVFGMESRG AGRLAFERGE AGIDFQTSSA YLASVKPLVD SGKAVPLFSM GVVDAEGNVA 
RDPSFPDLPT FVEFFTEATG AAPEGEAFEA WKALMIAGYS LQKMVVLPKE APPEVIAAYS 
EAARKIVEAP DFRERAGEEI GVYEQLVGEA ADAALKKALT VDPAIRTFLT TWLSEDYGVR 
F