Gene Rsph17029_3201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3201
Symbol
ID	4898687
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	242521
End bp	244353
Gene Length	1833 bp
Protein Length	610 aa
Translation table	11
GC content	63%
IMG OID	640113800
Product	hypothetical protein
Protein accession	YP_001045070
Protein GI	126463957
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGGTAC CCGTGCTGCC GATGCTCGAG GGCGAGACGC TCATGTCCTA TACCGGCCGC 
GTCGGTCGCT TTCACACGAC GCGCTCACCT CTGCAATTCC TGGAATTGAT CCAGCTTCGT 
CGGCGCGCGG TGGTCGAAGG AGCCGAGGAT GCTCTCAGCC GGCTCTCAAT GATGACGGGC 
CTGCCGGAGG AGCGGCTTTC CGCAGGGACC ATCGGCAGCG CGGGCGACAG GATATACACG 
TTCGGCGCCG AGCAGTTCCA CTCGGTATTC GCCATCCGCG ACACGGCAAC CTTCTGCCCC 
GCCTGCCTGC TTGAGGATCG TGTCGACGCA GCAACGAAGG GGCAGCGCGT CGGTCGGCTG 
ATTTGGCTTT TCCGGACTAC CCGCACCTGC CCGCGGCATG GCGTAGCGAT GATCCGGCGT 
CCGTCGGCCG CAATGGCTTT GGGCGGTTTT CTCGACATGG AAGCGGTCGC CGGATCCGAC 
GAAGAGCTTG AGCGGATCGT CCTGCAATTG CCGCGCCGCG ACGTGTCTCC TCTCCAGCGG 
TACGTGACCG AGCGCCTGCT CGGCGCGGCG GGTCCAGCCT GGCTCGATGG ACAGCAGATG 
GACCATGGCG CCCGTGCCAG CGAAATGCTC GGCGCCTGCC TGGAGTACGG TACCGACTTC 
GCGGCGAACG GCCTGAGCGA GGACGACTGG GACAGGGTTG GCCGTACCGG GTACGCGTAT 
ACAGCCCGCG GCACGGAAGG CGTCGCCGAG GCACTGCAGC TTCTGCACAC GCAGTTCCTG 
CAATCCGGGA AGGACGGGGG GCCCCAGCAG GTCTTCGGCT CGTTGTACAA ATGGCTGCAG 
TTCCGCCCCT ACGCGAAGCC AGCCGGGTTG ATCGAGGATC TGGTTCGCGA CTACATCCTT 
GATCATTTTT CGGTGGAGCC AGGAAAGAAA CTTCTCGGAG TTCCCGTGGT AAAGCGTCAA 
CGGCACAGCA TCGGAAGCCT TGCGGCGGCA ACCGGTCTTC ATCCCCGGAC CTTGAACCGC 
GCGCTCATCA TTACCGGAGT GCTTTCGGGT GACCCGGATG TGGTCGACGG ACGCTCGTCA 
TTCGATGCAA AGACGGGGGA AGATCTTGCC GGACGCATCC GGAACTCGAT CTCGACCACC 
CAACTGCCGA AGTATCTTGG GTGCAATAGA ACTCAGGCGC AGGAACTGGT GCGCAGTGGG 
GTGCTGCCCC GGATCGTGAA CCAGGATGGC AAGCAGACGG GGATGCTGTC GAACGTGCCG 
CTAGCCGAGG TCGACGACTT CCTACACCGG TTGCGCGCCG CAGGCGTTCT GGTCGATGCG 
CCCGGAGCCG GAATGATGGA CATCGTGGCG GCCTCGAGTG CCGCTCGCTG GCCTGCGCTT 
GACATCGTGA AACTCGTGCT CGCCGGCGCC CTCGCGCGCG TCGAGGTGCT CGGAACCGAT 
CTGAAGTTTC TCTCAGTGCT GGTCGATCCG ATGGAGGTGC GCGCAAAGAC CCATCTCGAG 
GAGACTGCCG ACGGCCTCAG TCAGGCGGCC GCCGCTCGCC TCCTCGGCGT GATGACCAGC 
GGGCTGACGT ACCTCGTGCA GAACAAAGAC CATGATGGCA AGCCGTTCAT CCCTTACATC 
CCGGTGCGCA ACTCGGCAGG CAGGGAACAA CGTTATTTTG ACGCGCGCGA GCTAGCGCGG 
TTTTCCGACC GGTACATTCA TCTCAAGGAT GCGGCGCGCC AGGCAGGAAT CTCGTCAAAA 
CTGATGCGGC AGCATCTCGC GAGCCGAGGC ATCGAGCCGA TTGCACCGAG AAATGTGCTG 
AACGCTCAGA TGTACCGACG ATCCGAGATC TGA

Protein sequence

MLVPVLPMLE GETLMSYTGR VGRFHTTRSP LQFLELIQLR RRAVVEGAED ALSRLSMMTG 
LPEERLSAGT IGSAGDRIYT FGAEQFHSVF AIRDTATFCP ACLLEDRVDA ATKGQRVGRL 
IWLFRTTRTC PRHGVAMIRR PSAAMALGGF LDMEAVAGSD EELERIVLQL PRRDVSPLQR 
YVTERLLGAA GPAWLDGQQM DHGARASEML GACLEYGTDF AANGLSEDDW DRVGRTGYAY 
TARGTEGVAE ALQLLHTQFL QSGKDGGPQQ VFGSLYKWLQ FRPYAKPAGL IEDLVRDYIL 
DHFSVEPGKK LLGVPVVKRQ RHSIGSLAAA TGLHPRTLNR ALIITGVLSG DPDVVDGRSS 
FDAKTGEDLA GRIRNSISTT QLPKYLGCNR TQAQELVRSG VLPRIVNQDG KQTGMLSNVP 
LAEVDDFLHR LRAAGVLVDA PGAGMMDIVA ASSAARWPAL DIVKLVLAGA LARVEVLGTD 
LKFLSVLVDP MEVRAKTHLE ETADGLSQAA AARLLGVMTS GLTYLVQNKD HDGKPFIPYI 
PVRNSAGREQ RYFDARELAR FSDRYIHLKD AARQAGISSK LMRQHLASRG IEPIAPRNVL 
NAQMYRRSEI