Gene Rsph17025_3287 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3287
Symbol
ID	5085778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	-
Start bp	159154
End bp	160755
Gene Length	1602 bp
Protein Length	533 aa
Translation table	11
GC content	70%
IMG OID	640484859
Product	hypothetical protein
Protein accession	YP_001169476
Protein GI	146279318
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGCCG ACTACATCAT CGTCGGCGCC GGCAGCGCGG GCTGCGTGCT GGCGAACCGC 
CTGTCCAGGG ATCCGCGCAA CCGGGTGCTG CTGATCGAGG CCGGCAAGCG CGACAACTAC 
CACTGGGTCC ACATTCCCGT GGGTTACCTC TACTGCATCA ACAATCCCCG CACGGACTGG 
TGCTTCACCA CCGAGCCCGA GGAAGGGCTC GAGGGCCGCA GCCTGATCTA TCCCCGCGGC 
AAGGTGCTTG GGGGGTGCTC CTCGATCAAC GGCATGATCT ACATGCGCGG GCAGGCCGAG 
GATTACGACG GCTGGCGCCA GATGGGCTGC ATCGGCTGGG GGTGGGAGGA TGTGCTGCCC 
CTCTTCCGCC GCCAGCAGGA CCACCACCTC GGCGAGAACG AGCACCACGG TGCGGGCGGC 
GAATGGCGGG TCGAGCGCGC ACGGGTCCGG TGGGCCGTGC TCGACGCCTT CCTTGATGCG 
GCCGAGCAGG CGGGCATTCC CCGGACCGAG GATTTCAACC GCGGCTCGAA CGAGGGCGGC 
GGCTATTTCG ACGTGAACCA GAGGTCCGGC ATCCGCTGGA ACACGGCCAA GGCCTTCCTG 
AAGCCCGCCC TCGCCCGGCC GAACCTCCGG GTCGTGACCG AGGCGCAGGT GGTGCGGCTG 
ATCGTCGAGG AGGGGGACGT CCGCGGGGTT CTCTACCGGC AGGCGGGTGA GCTGCGCGAG 
GCGCGGGCCG CGCGCGAGAC GGTGCTTTCG GCGGGCGCCA TCGGCTCGCC GCACATCCTC 
GAGTTGTCGG GCATCGGCGA CCCCGAGGTG CTGCGCGCCG CCGGCGTCGC GACCACGGCC 
GCCGTGCCGG CCGTTGGCGC GAACCTGCAG GACCATCTGC AGCTCCGCCT CGTCTTCAAG 
GTGCAGGGCG TGCCCACGCT GAACGAGAAG GCCACGAGCC TCTTCGGCCG CGCGGCCATC 
GGGGCGGAAT ATCTCCTCCG CCGTTCGGGG CCCATGTCGA TGGCGCCGAG CCAGGTCGGG 
ATCTTCACCC GCTCGGGCCC CGAAAAGGCC ACGCCGGACC TCGAATTTCA TGTCCAGCCG 
GTCTCGCTCG ACAAGTTCGG CGACAAGGTG CACCCCTTCC CCGGCATGAC CGCCAGCGTC 
TGCAACCTGC GCCCTGAAAG CCGCGGCAGC GTGCATCTGA AAAGCCCCGA CCCCACACGC 
CAGCCCGCCA TTGCGCCGCA CTACCTCTCG ACCGAGGGGG ACCGCGAGGT GGCGGTGCGT 
TCGATCCTGC TCGCGCGCCA CATCGCGGCG CAGCCCGCGT TCGCCCGTTT CCACCCCGAG 
GAATACCGCC CCGGCGCCGA GGTGCAGAGC CGCGAGGATC TGGTGGCGGC CGCGGGCCGC 
ATCGGGACCA CCATCTTCCA TCCCGTAGGC ACCTGCCGCA TGGGCGCCGA CGAGGCGAGC 
GTGGTCGATC CGCGGCTTCG GTTCCGCGCG CTCGGCCGGC TGCGCATCGG GGATGCCTCG 
ATCATGCCGA CCATCACGTC GGGCAACACC AACTCACCGA CGCTGATGAT TGCCGAAAAG 
GCGGCCGAGA TGATCCTCGA GGACGCGCGC CACCCTGCCT GA

Protein sequence

MEADYIIVGA GSAGCVLANR LSRDPRNRVL LIEAGKRDNY HWVHIPVGYL YCINNPRTDW 
CFTTEPEEGL EGRSLIYPRG KVLGGCSSIN GMIYMRGQAE DYDGWRQMGC IGWGWEDVLP 
LFRRQQDHHL GENEHHGAGG EWRVERARVR WAVLDAFLDA AEQAGIPRTE DFNRGSNEGG 
GYFDVNQRSG IRWNTAKAFL KPALARPNLR VVTEAQVVRL IVEEGDVRGV LYRQAGELRE 
ARAARETVLS AGAIGSPHIL ELSGIGDPEV LRAAGVATTA AVPAVGANLQ DHLQLRLVFK 
VQGVPTLNEK ATSLFGRAAI GAEYLLRRSG PMSMAPSQVG IFTRSGPEKA TPDLEFHVQP 
VSLDKFGDKV HPFPGMTASV CNLRPESRGS VHLKSPDPTR QPAIAPHYLS TEGDREVAVR 
SILLARHIAA QPAFARFHPE EYRPGAEVQS REDLVAAAGR IGTTIFHPVG TCRMGADEAS 
VVDPRLRFRA LGRLRIGDAS IMPTITSGNT NSPTLMIAEK AAEMILEDAR HPA