Gene Rsph17029_4014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_4014
Symbol
ID	4899048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	+
Start bp	1157960
End bp	1159120
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	74%
IMG OID	640114617
Product	hypothetical protein
Protein accession	YP_001045864
Protein GI	126464751
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.244675
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGATCC GTGCGGCTCT GGCGGCTCTC GTGCTTCTCG CGGCCACGAC GGCCGGGGCC 
GAGACCCCTG AGCGGCGGCT CGAGATCCTG GCCTTCCCCC GCGCCGACAG CGTGGTGGCG 
GGCGAGATGG TGCCGGTGAC GGTGCGCGGC ATCTACGACC GCAAGGTGAC GCTCGAGGAG 
ATGACGATCC GGCCCGACGA CAGCTTCGAC TGGGTGCAGC TGGCCAAGGA CGACTGGCAC 
GAGGAGCGCA TCGACGGCCG CCTGCGGCTG GTGGTCGAAC GCAGGCTCGC GCTCTTTCCC 
AAACATTCCG GCTCGTCGCG CTTCGGGCCC GCCGAGCACC GGCTGACCTT CGTCGGCGCG 
GGCGGGAAGG CGGAGACCAT CACCTCGCAT CCGCTCGACC TGTCGGTGGC GCCCATGCCC 
GACGATCCGC CCTTCCACAG CCCGCACGGC TGGCGCTTCG CCGTCTCCGA GCTGAGGGTG 
ACGGATGAGC TCAGCACCGA TCCGGCCCGG CTCAAGGACG GCGAAACCGT GACGCGGCGC 
GTGACAGTGA CCGCGGTGGG CGCGCTGCCC GCGATGCTGC CGCCGCGGCC CGTGGTCTCG 
GAGAACTGGC TCATCGCCTT CGCGGCTCCG GTCGAGCGGT CGCTGGAGCT GACGCCGGAC 
GGCCCCGTGG CGCGGGTGAT CTGGAGCTGG CAGTTCCGCC CCGAGACCGG CGAGCCCGGC 
GTGCTGCCCG CCGTGCCGAT CCCCTATTTC AACACGGTGA CGCGGAAGGT GGAGGCGGCC 
GAGATCCCCG CGCTGCCCAT CGGCTATGCG AGCTTCGCCG CCTCGCAGTC GGCCGGCATC 
GCCATCACGC CGGCGAGCCT CTGGGGAGGG CTGGCGGCCG GTCTGGCGGG GCTCAGCGCG 
GGGACGGCGC TGCTCGTGGC CGGCCACCGG CCGACGGCCG CGGCGCTCGG ACGGCTCGCG 
CGGCGGCGCT CGCCCTTCCG CCGCTGGCAG ATCTGGCGCG CGGCACGGGC GGGTGACCTG 
CTCGCGCTCC GCCGGGCCAC CGAGGAGGAG GCGCTCGACA GGCCTGCAGC GCGCGCCGCG 
CTCGAACGGG CGATCTACGG CCCGCCGCCG CAGCCCTTCG ACGCGCGCGC CTTCCTGCGG 
ACCCTGCGCC GGAAGGCTTG A

Protein sequence

MVIRAALAAL VLLAATTAGA ETPERRLEIL AFPRADSVVA GEMVPVTVRG IYDRKVTLEE 
MTIRPDDSFD WVQLAKDDWH EERIDGRLRL VVERRLALFP KHSGSSRFGP AEHRLTFVGA 
GGKAETITSH PLDLSVAPMP DDPPFHSPHG WRFAVSELRV TDELSTDPAR LKDGETVTRR 
VTVTAVGALP AMLPPRPVVS ENWLIAFAAP VERSLELTPD GPVARVIWSW QFRPETGEPG 
VLPAVPIPYF NTVTRKVEAA EIPALPIGYA SFAASQSAGI AITPASLWGG LAAGLAGLSA 
GTALLVAGHR PTAAALGRLA RRRSPFRRWQ IWRAARAGDL LALRRATEEE ALDRPAARAA 
LERAIYGPPP QPFDARAFLR TLRRKA