Gene Rsph17025_4217 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_4217
Symbol
ID	5086388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009430
Strand	+
Start bp	259707
End bp	260909
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	65%
IMG OID	640485778
Product	hypothetical protein
Protein accession	YP_001170372
Protein GI	146280215
COG category	[S] Function unknown
COG ID	[COG3177] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	0.921636
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	0.168634
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGAGA CACCCGGCAG GATTGAACCA TGCTTCTTCG AAGAGCACAT ACCTGCCAGC 
CTCGCGGACC TGTCGGTCGA GATTCAGCGC GAAGCGGCGA ACCTCGGCCA GGGTCTCCAC 
CCGGACAGCG CAGCCGAACT GGCGGACCTC GTCAGGGTGA TGAACTGCTA CTACTCGAAC 
CTGATCGAGG GGCACAACAC GCGCCCGCGC GACATCGAAC GCGCCCTCGC GGGGGCCGAG 
CTTGAGGCGG AGACACGCCC GCTTGCGCTG GAGGCTCGAG CCCATGTCAT CGTCCAGCGA 
ACAATCGACA GGATGCATCG GGAAGGCACC TTGCTCCGGC CCACATCCGT CGCGTTCCTC 
ACCTGGGTAC ACAAGGCCTT CTACGACGAG ATGCCCGACG AGTTCCGGCA TGTCGAACAT 
CCGGATGGAA CGACCGAGCC GATCATTCCG GGCCGCATGC GGCAGGAGGG CGACCGCGAA 
GTCGCCGTCG GCCGCCATCT TCCCCCCTCC TCGAGTCGGG TCGCGCCCTT CATGGATCAC 
TTCGACAAGC GATTTCAGAT CGCGGCCCGC TCGGCGAGCG GACGGATCAT CGCCATCGCC 
TCGGCACACC ACCGGCTAAA CTACATACAC CCGTTTCCCG ACGGGAACGG GCGGGTCAGC 
CGGCTGATGT CGCATGCGAT GGCGCTCGAA GCAGGCATTG GAGGCCAAGG CTTATGGTCC 
GTTTCGCGCG GGCTGGCGCG CGGGCTGGCG GATCGGGGCG AATACAAGCG CATGATGGAC 
ATGGCCGACT CCCCCCGTCG CGGCGATCGC GACGGGCGGG GCAATCTGTC CGAGGCTGCC 
CTGAAGACCT ATTGCGAATG GTTCCTGACG GTCACGCTGG ATCAGATCAC CTTCTCGGCC 
AAGCTCTTCG ACCTTGGCGG CCTGGAAAAG CGCTACCGGC GTCTGGTCGA AGACACGGTC 
GACGACAAGC GTGCGCCCGA CCTCATCTCG GCGGTCCTTC GCTATGGCAC GCTGGAACGC 
GGCGAGGCGC AGATCGTCCT CAAGACGTCC GAGCGCACGG CGCGCAACAC GCTGAGCAAG 
CTGACATCAG CCGGCTACCT GTCATCAGCC TCACCGAAGA CGCCCGTGCG GCTCGCTTTT 
CCTCTCGACT ACCGGGAGCG CCTTTTCCCG AACCTGTTCG CTGATGCGTG CCTGCCCGGG 
TAA

Protein sequence

MRETPGRIEP CFFEEHIPAS LADLSVEIQR EAANLGQGLH PDSAAELADL VRVMNCYYSN 
LIEGHNTRPR DIERALAGAE LEAETRPLAL EARAHVIVQR TIDRMHREGT LLRPTSVAFL 
TWVHKAFYDE MPDEFRHVEH PDGTTEPIIP GRMRQEGDRE VAVGRHLPPS SSRVAPFMDH 
FDKRFQIAAR SASGRIIAIA SAHHRLNYIH PFPDGNGRVS RLMSHAMALE AGIGGQGLWS 
VSRGLARGLA DRGEYKRMMD MADSPRRGDR DGRGNLSEAA LKTYCEWFLT VTLDQITFSA 
KLFDLGGLEK RYRRLVEDTV DDKRAPDLIS AVLRYGTLER GEAQIVLKTS ERTARNTLSK 
LTSAGYLSSA SPKTPVRLAF PLDYRERLFP NLFADACLPG