Gene Rsph17029_3845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_3845
Symbol
ID	4898574
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009050
Strand	-
Start bp	975363
End bp	976583
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	67%
IMG OID	640114449
Product	hypothetical protein
Protein accession	YP_001045697
Protein GI	126464584
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.521345
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCACCCGA TCGGCCCAGC GGCCGCGCTG CCGGTGCACG GCGATGGGGG GATGATGCAG 
AACGAGCGGA TCGGCGAGGC CGGAACCCTT CTGGAGCCGG AAGCGCCCGA CGTGCCCTCC 
GAGAACGAGA TCAGCCGTCT CAACCACCTG ATCGCGATCC GCAGGCTGCT GGGGATCATC 
CTTCTGGTCC TCGTGGTCAT GGGCTTCTAT TTCGCCCGCG ACGTGGTCCT GCCGCTGATG 
ATCGGCCTTC TGCTGGCGCT GACCTTCAGC CCGGTCGTGC GGGCCCTGCA GCGGATCGGC 
ATCGCACCGC CCATCACCGC GACCGCCCTC ATCACCGCCC TCGCCGCCGT CATCGCGGTC 
AGCGCCTTCC TTCTGAGCGG CCCTGTCTCG GACTGGATCA ATCAGGCGCC GCGGCTGGGC 
GATCAGCTGC GCGAGCGGGC CCAGACCATC CTCGACTCGT TCGAGGCGGT GCGGAACGCA 
TCGGAGCAGG TCTCGGAAAT CACCGACAGC GAGGATCCGA CGGTGCAGCG CGTCGCCGTG 
CAGACGCCGG GGATCCTGTC GTCCGCAGTC GGCAGCGTGG CCTCGATCCT CACCACGATC 
ATCGTGACGC TGGTGCTGGC GCTCTTTCTG CTCGCCTCGG GTGACCTGTT CTACATCAAG 
CTGATCGAGG GCTTCCCCCG CTTCGGCGAC AAGAAGCGCG CCCTGCGCAT CGTCTACGGC 
ATCGAGCGGC GCGTCTCGCG CTACCTCCTG TCGGTGACCA TCATCAATGC GGGGCTGGGG 
GTGGTGATCG GCCTCCTGAT GTGGGGCACG GGAATGCCGA GCCCGCTCGT CTGGGCCATG 
GCGGCCTTCC TTCTGAACTT CCTGCCCTAT ATCGGCGCCA TTGCCGGGGT TGCGCTGTCG 
GCGGCCGTCG CCATCGTGCA TTACGATCAC CTGACGCAGG CCCTGCTGGT GCCCGCGCTC 
TACCTGACGG CCACCGCCAT CGAGGGGCAG CTCGTCACCC CCATCGTCCT CGGCCGCAGG 
CTCGAGCTGA ACACGGTCTC GGTCTTCGTC ACGGTGATCT TCTGGGGATG GCTCTGGGGC 
ATTCCGGGGG CGCTCGTGGC GGTGCCCTTC CTCGTCTGCA TCAAGGTGGT CTGCGACAAT 
GTCGAATCCC TGCATGCGGT CGGCAATTTT CTGGGCGCTC GCGCGCCGTT GCCCGATCTC 
GAGCAGGATA CGCCGGAGTA A

Protein sequence

MHPIGPAAAL PVHGDGGMMQ NERIGEAGTL LEPEAPDVPS ENEISRLNHL IAIRRLLGII 
LLVLVVMGFY FARDVVLPLM IGLLLALTFS PVVRALQRIG IAPPITATAL ITALAAVIAV 
SAFLLSGPVS DWINQAPRLG DQLRERAQTI LDSFEAVRNA SEQVSEITDS EDPTVQRVAV 
QTPGILSSAV GSVASILTTI IVTLVLALFL LASGDLFYIK LIEGFPRFGD KKRALRIVYG 
IERRVSRYLL SVTIINAGLG VVIGLLMWGT GMPSPLVWAM AAFLLNFLPY IGAIAGVALS 
AAVAIVHYDH LTQALLVPAL YLTATAIEGQ LVTPIVLGRR LELNTVSVFV TVIFWGWLWG 
IPGALVAVPF LVCIKVVCDN VESLHAVGNF LGARAPLPDL EQDTPE