Gene Rsph17025_3593 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3593
Symbol
ID	5085745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009429
Strand	+
Start bp	483274
End bp	484986
Gene Length	1713 bp
Protein Length	570 aa
Translation table	11
GC content	69%
IMG OID	640485151
Product	hypothetical protein
Protein accession	YP_001169767
Protein GI	146279609
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2303] Choline dehydrogenase and related flavoproteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.185956
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.226258
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAGCGG ATCCGACTTT CGACGTCGCC ATCGTGGGCA GCGGTCCCGC CGGTCTGGCC 
GTTGCCAGCC GCCTTGTCGG CCGCGGCCTC TCTCTCGTTC TGATCGAGGC TGGCAACGCC 
GATCGCGACC GGCAGGACGA ACAGGACAGC CTCTCCGCCG AGAATGAGGT GGGGCCGAAA 
CATCCGGCTG CGCATCTCTA CCGCCGGCGG ATGCTGGGGG GATCCTCGAC CGTCTGGGGC 
GGGCGCTGCA TTCCGTTCGA TCAGGCCGAC TATCTCATCG GCGGCGACGG GACCGGCTGG 
CCCATCGACC CCGCCGAGAT CGAGCGCCAC CAGCGGGTGG CGGCAGAGTT CCTCGACTGC 
GGCGAGCCGC AGTTCGACGA GGCGGCCTTC GAGACGCCCG CATGGTGGAG CCGCTCTCCG 
CGGATCGACC TCGACCTTGA CCTGATCGAA CGGTTCTCGC GCCCGACAAA CCTCTGGCGC 
AAGATGCGCG ACAGCCTGCG CGCGCGGAGC GACCTCAGGC TCCTCGCGGA TCATGTGGTG 
GTGCGGGTGG ACCTCTCGTC CGATGGCACC CGCGTCGAGG GGCTGCGGAC GATCGACCGC 
CGCTCGGGAT CCGGCGACCT TCTGCGCGCA CGTCATGTGG TTCTTGCCTG CGGAGGGATC 
GAGACCACCC GGCTGCTCCT GGCCTCGAGG AACGTCCAGC CGCGCGGGAT CGGCAACCAC 
AGCGATCAGC TTGGCCGCCA CTACATGACG CATCTCATCG GCGATGTGGG CGAGCTGGAC 
CTTTCGCCCG CCTTCGATCA GGCGCGCATC GATTACCGCC GGACCCGGGA CGGGATCTAT 
GCCCGCAGCC TGATCCGGCT CTCGCCGGCC CTCCGCCTGA GGGAGCGCCT GCCGAATGCG 
GTCTGGCGCC CGGTGTCGCC GCCCTTCTGG AACCCGTCCC ATCACGATCC GATCCTGTCG 
GCGGTCCATC TGGCCAAGGC GATCCTTCCC AAGGAGTACC ACGGCCATCC CGCCGAGGCG 
CTCGCGCAGC GGAACGGCTG GCGCGACCCG GCCGCCCATG TCGCCAACAT CCTGCGCCAT 
CCGGGCACTC TGGCCGCCTA TGTGCCGGTG ATCATGGCAA AGCGCATTCT CGCCCGGCGC 
AAGCTGCCCT CGGTGTTCCT GCTTCGCCCG GACCGTCACT ACCGTCTGGA GATCAATGCC 
GAGCAGCTCC CGGATCCGTC CTCGCGCATC ACGCTGGGCG ACAGCCGGGA CCGCTGGGGC 
ATGCCGCGGA TCCGCCTCGA CTGGCAGGTG AACGGTGCAA CCCTCGAAGG CGTGCGCCAG 
AGCCTCGCCC ACCTCGCCGG GCTGATGCCG AAACACGGGG TTGGCCGCCT TCTCATGCAG 
CCCGACCAGG TCGCCGAGGG GCTGGTCTCG CAGGGCGGTC ACCACATCGG CACAACGCGG 
ATGGGCAAGT CCCCGGAGAG GGGCGTGGTG GACAGCGATT GCACCGTCTT CGGCGTGCCG 
AACCTCCATA TTGCGGGGGC ATCGGTCTTC CCGACTTCGG GGGCGGTGAA CCCGACGCTG 
CTGCTGACCT GCGTGGCCTT CCGCCTCGCC GATCATCTGC TTGCCCGACT TGCGCCCGCA 
CCCGTCCTTG CGCTTGCCAC CTCCGAACCC GCCCCGCCGC GTCCGCTCGC CGAGCTGCCC 
CCGGTCGCGG CCGCCGTGCA GGCCCTACCC TGA

Protein sequence

MEADPTFDVA IVGSGPAGLA VASRLVGRGL SLVLIEAGNA DRDRQDEQDS LSAENEVGPK 
HPAAHLYRRR MLGGSSTVWG GRCIPFDQAD YLIGGDGTGW PIDPAEIERH QRVAAEFLDC 
GEPQFDEAAF ETPAWWSRSP RIDLDLDLIE RFSRPTNLWR KMRDSLRARS DLRLLADHVV 
VRVDLSSDGT RVEGLRTIDR RSGSGDLLRA RHVVLACGGI ETTRLLLASR NVQPRGIGNH 
SDQLGRHYMT HLIGDVGELD LSPAFDQARI DYRRTRDGIY ARSLIRLSPA LRLRERLPNA 
VWRPVSPPFW NPSHHDPILS AVHLAKAILP KEYHGHPAEA LAQRNGWRDP AAHVANILRH 
PGTLAAYVPV IMAKRILARR KLPSVFLLRP DRHYRLEINA EQLPDPSSRI TLGDSRDRWG 
MPRIRLDWQV NGATLEGVRQ SLAHLAGLMP KHGVGRLLMQ PDQVAEGLVS QGGHHIGTTR 
MGKSPERGVV DSDCTVFGVP NLHIAGASVF PTSGAVNPTL LLTCVAFRLA DHLLARLAPA 
PVLALATSEP APPRPLAELP PVAAAVQALP