Gene Rsph17025_3248 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3248
Symbol
ID	5085997
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	+
Start bp	116117
End bp	117559
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	69%
IMG OID	640484820
Product	hypothetical protein
Protein accession	YP_001169437
Protein GI	146279279
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.713925
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.212703
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTGG CTCCGCCCGA AAGCGTCGCC GGCGAGCATT TCGACGTGGT GATCGTGGGC 
TCGGGCTTCG GCTCTTCCTT TTTCCTGCAC AGGCTGATGC GGCAGCCCGG CCGGCGGGTG 
CTCGTCCTTG AATGGGGCGG TCACGCGACG CATGACTGGC AGCTTGACGA GGGCCGGAAC 
TCGTCGGTTG CCGACAGCGA CACCTATGCC ACCAACTCCG ACAAGCCCTG GAACTTCACC 
GTCGGGTTCG GGGGCGGCAC GAACTGCTGG TTTGCCCAGA CGCCCCGGCT TCATCCGGCC 
GATTTCCGGC TGGGAACCGA TCATGGCGTG GCGCCGGACT GGCCGATCAC CTACGACGAT 
CTCGAGACCT ACTGGTGCGA CGCGGAAGAG ATCATGGCGG TCTCCGGCGA TCCCGACATG 
GCGCGCGTCA TGCCGCGCTC GCGTCCCTTC CCGCAGCCGC CCCATCGGAT GCCCGATCCC 
GACCGGCTGA TGAAGGCGGC CCGCCCCGAC AGCCACTTCG TCATGCCGAC GGCGCGGGCC 
CGGATCGCCA CCGAGACGCG GGCCGCCTGC TGCGCGTCGC TGCGTTGCCA GATCTGCCCC 
GCCGACGCCA AGTTCACCGC CAACAACTCG CTCGTGCCGC TCTATGAGGC CGAGGGCGTC 
ACGCTCTGTC TTGAGGCCGA GGTGCGCCGG TTCGAGGCGG CGGGCTCGTC CATCTCGGCC 
GCCGTGTTCC GGGGCTCGGA CGGGCGCGAG CACCGCGTGA CGGGGGATCT CTTCGTCCTT 
GGCGCCAATG CGATCCACAG CCCCGCGATC CTTCTCCGGT CCGATCTGGG GGGCGGGCTG 
ACGGGTGTGG GGCTGCATGA ATCCTACGGC TGGTCGATGG AGGCCTGGCT CGACGGTGTG 
GAGAATTTCG GCGGCAGCAC CATCACGACC GGCCTCGACT TCGGCCTCTA TGACGGGCCG 
CACCGCAAGA CCGAGGGCGC CGCGCTGGTC TATTTCGAGA ACCGCTGGTC GCACGGGATG 
CGCCTTGGCG CCGAGCGGAT GCGCCAGACG CTGCCGCTGG TGATCGTGAC CGAGGATCTG 
CCGGAAAACA GGAACCGCGT GACGCTCGAC GGTGAGGGCG GGGCCTTCGT CGAGTATCAC 
GGGCCGTCGG ACTATGCGCT GCGCGGGATG GAGCGGGCGA AGGCCGCGCT GCCGGATCTG 
TTGGCGCCGC TGCCGGTCGA GCGGATCCTC GACCACGGCA TCCGCGAGAC GGAGTCGCAT 
CTGCAGGGCA CGCTGCGGAT GGGCCACGAT CCGGCCACCT CGGTCGTCGA TGCGGGGCTC 
GTGCATCACC GGCTGCGCAA TCTCGTCGTG GTGGGGACGA GCACCTTCCC CACCTGCTCG 
GCCGCCAATC CCTCGCTGAC CGCCGCGGCG CTTTCGCTGC GCGCGGCCGA CCTGCTGATC 
TGA

Protein sequence

MNLAPPESVA GEHFDVVIVG SGFGSSFFLH RLMRQPGRRV LVLEWGGHAT HDWQLDEGRN 
SSVADSDTYA TNSDKPWNFT VGFGGGTNCW FAQTPRLHPA DFRLGTDHGV APDWPITYDD 
LETYWCDAEE IMAVSGDPDM ARVMPRSRPF PQPPHRMPDP DRLMKAARPD SHFVMPTARA 
RIATETRAAC CASLRCQICP ADAKFTANNS LVPLYEAEGV TLCLEAEVRR FEAAGSSISA 
AVFRGSDGRE HRVTGDLFVL GANAIHSPAI LLRSDLGGGL TGVGLHESYG WSMEAWLDGV 
ENFGGSTITT GLDFGLYDGP HRKTEGAALV YFENRWSHGM RLGAERMRQT LPLVIVTEDL 
PENRNRVTLD GEGGAFVEYH GPSDYALRGM ERAKAALPDL LAPLPVERIL DHGIRETESH 
LQGTLRMGHD PATSVVDAGL VHHRLRNLVV VGTSTFPTCS AANPSLTAAA LSLRAADLLI