Gene Rsph17029_0215 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_0215
Symbol
ID	4895797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	234013
End bp	235233
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	68%
IMG OID	640110798
Product	hypothetical protein
Protein accession	YP_001042106
Protein GI	126460992
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.776259
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGGGCA CGGCCGTCAC TGCAATGAAC GAGACGAGAA CAGACAGGCT GGGCGAGCAC 
CGGCTGCCGC CGAAACGCGT GCGCAGACCC CTCATCACCG ACATTTCAGC CGCCCGCTGG 
CTGCTTCTGC TGATTCTCGC AGCGTCGGTC TATTTCTTCC ACGGCTTCCT CGTACCGGTG 
CTGGCGGCGC TCATTATCGC CTTTGCGAGC TGGCCGCTGA TGCTGAAGCT CGAGCGGTCG 
CTTCCGATCA GCCGCGGCAT CGCGGGCGCA CTTCTTGTCA TGATGATCGT GGGCTTCCTC 
GTGATCCCGG TCATGATGGC GCTGCTCTAT GCCTTCCGCG AACTGCAGGC CTGGATCGGC 
TGGGCGATCA ATACGAACAG CACCGGCGCG CCGCCGCCGG TCTGGCTCGA GGCGCTGCCG 
CATGTGGGGC CCTGGGTCGG CGAGAAGTGG CGGACCTACA TCGGCGAGCC GGGGGCGATC 
AGCGAGATGG TCCAGCTCGT CTCGGGCGCC AACATCGGCA CGATCTCGCG CGGGATCCTG 
ACGGCGGGCA CGCTGGCCTT CCACCTCGCG CTGACCCTGC TCTTCATGCT GATCGCGCTC 
TTCATCTTCT ACCGCGACGG CGAGCGGATC GCGGCGCAGG TGGACCGCGT CGGCACCCGC 
ATCCTCCCCG ACCGCTGGGA CCGGATCTCG CGCGTGGTCC CTGCCACCAT CAGTTCGACC 
GTGACCGGCA TGACGCTGAT CGCCATGGGC GAGGGCGTCG TGCTGGGCAC GGCCTACTGG 
ATCGCGGGGA TGCCTTCGCC GGTGACGCTC GGCGTCATCA CGGGCTTCAT GGCCCTCATT 
CCGGGGGGCG CGCCCTTCTG CGTGATCGTG GCCTCGTCCT ATCTCGCGGC CAGCGGCTCG 
CCCTGGGCGG GGCTCGGCCT CTTCCTCTGG GGGACGGTGG AACTCTTCGT CGTCGACAAG 
ACGATCCGCC CCGTGCTGGT CGGCGGACCG GTGAAGCTGC CGTTCCTGCC CACCTTCTTC 
GGCCTCGTGG GCGGCATCGA GACCATGGGG ATCGTGGGCC TCTTCGTCGG GCCGGTGCTG 
ATGGCGCTGC TCGTCGCCAT GTGGCGCGAA TGGCAGCGCG AGATCGACAT CGCCGAGACG 
GAGGAGATGG GGCACCCGCT GGAGCCCCTG CCCGACCCTC TGCCCGCCCC GCTCCACCCG 
TTCCGCTCCG AGTCGCGCTG A

Protein sequence

MGGTAVTAMN ETRTDRLGEH RLPPKRVRRP LITDISAARW LLLLILAASV YFFHGFLVPV 
LAALIIAFAS WPLMLKLERS LPISRGIAGA LLVMMIVGFL VIPVMMALLY AFRELQAWIG 
WAINTNSTGA PPPVWLEALP HVGPWVGEKW RTYIGEPGAI SEMVQLVSGA NIGTISRGIL 
TAGTLAFHLA LTLLFMLIAL FIFYRDGERI AAQVDRVGTR ILPDRWDRIS RVVPATISST 
VTGMTLIAMG EGVVLGTAYW IAGMPSPVTL GVITGFMALI PGGAPFCVIV ASSYLAASGS 
PWAGLGLFLW GTVELFVVDK TIRPVLVGGP VKLPFLPTFF GLVGGIETMG IVGLFVGPVL 
MALLVAMWRE WQREIDIAET EEMGHPLEPL PDPLPAPLHP FRSESR