Gene Rsph17025_3044 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_3044
Symbol
ID	5084383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	3113490
End bp	3114686
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	68%
IMG OID	640484615
Product	hypothetical protein
Protein accession	YP_001169233
Protein GI	146279074
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGAGA CGAAATCCGA AGCGCTGAGT GACCGACAGG ATCGGCTCAA ACGCGCACGC 
AAGCCGCTCA TCACCGACAT TTCGGCGGCG CGCTGGCTGC TCCTGCTGAT TCTGGCCGCG 
TCGGTCTATT TCTTCCACGG CTTCCTCGTG CCGGTGCTGG CGGCTGTCAT CATCGCCTTC 
GCAAGCTGGC CGCTGCTGCA GAGGCTCGAG CGGTCGCTGC CGATCGGCCG CGCCGGGGCT 
GGGGCCTTGC TGCTGATGAT GATCGTGGGC TTTCTCGTGA TCCCGGTCAT GATGGCGCTG 
CTCTATGCCT TCCGCGAGCT GCAGTCCTGG ATCGGCTGGG CGATCAACAC CAACAGCCTC 
GGTGCACCGC CGCCGGTCTG GCTCGAGACG CTGCCCCATG TCGGGCCCTG GATCGGCGAG 
AAGTGGCGCG CCTATATCGG CGAGCCGGGC GCGATCAGCG AGATGGTCCA ACTCGTCTCG 
GGCGCCAACA TCGGCACGAT CTCGCGCGGG ATCCTGACGG CGGGCACGCT CGCCTTCCAC 
CTCGCGCTGA CGCTGCTCTT CATGCTGATC GCGCTCTTCA TCTTCTACCG CGACGGCGAG 
CGGATCGCGG CGCAGGTGGA CCGCGTGGGC AGCCGCATCC TGCCCGACCG GTGGGACAGG 
ATCTCGCGCG TGGTGCCGGC CACGATCAGT TCGACCGTGA CCGGCATGAC GCTGATCGCC 
ATGGGCGAGG GCGTGGTGCT CGGCACCGCC TACTGGATCG CCGGGATGCC CTCGCCGGTG 
ACGCTGGGCG TCATCACGGG TTTCATGGCG CTGGTGCCGG GGGGCGCTCC CTTCTGCGTC 
GTCGCCGCCT CCTCCTATCT CGCGGCCAGC GGCTCGCCCT GGGCGGGGCT CGGCCTCTTC 
CTCTGGGGCA CGATCGAGCT GTTCATCGTG GACAAGACCA TCCGTCCGGT GCTCGTCGGC 
GGGCCGGTCA AGCTGCCCTT CCTGCCCACC TTCTTCGGCC TTGTCGGCGG GATCGAGACC 
ATGGGCATCG TCGGCCTGTT CGTGGGCCCG GTGCTGATGG CGCTGCTCGT CTCGATGTGG 
CGCGAGTGGC AGCGCGAGAT CGACATCGCC GAGGCCGAGG AGGCCGATCC GATCCCCCGG 
CCACCGCCCG AGCCGCTTCC CTCCGCAATC CGCCCCCTCA GATCCGAACC GGGCTGA

Protein sequence

MNETKSEALS DRQDRLKRAR KPLITDISAA RWLLLLILAA SVYFFHGFLV PVLAAVIIAF 
ASWPLLQRLE RSLPIGRAGA GALLLMMIVG FLVIPVMMAL LYAFRELQSW IGWAINTNSL 
GAPPPVWLET LPHVGPWIGE KWRAYIGEPG AISEMVQLVS GANIGTISRG ILTAGTLAFH 
LALTLLFMLI ALFIFYRDGE RIAAQVDRVG SRILPDRWDR ISRVVPATIS STVTGMTLIA 
MGEGVVLGTA YWIAGMPSPV TLGVITGFMA LVPGGAPFCV VAASSYLAAS GSPWAGLGLF 
LWGTIELFIV DKTIRPVLVG GPVKLPFLPT FFGLVGGIET MGIVGLFVGP VLMALLVSMW 
REWQREIDIA EAEEADPIPR PPPEPLPSAI RPLRSEPG