Gene Rsph17025_1074 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1074
Symbol
ID	5083366
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	+
Start bp	1102242
End bp	1103486
Gene Length	1245 bp
Protein Length	414 aa
Translation table	11
GC content	72%
IMG OID	640482632
Product	hypothetical protein
Protein accession	YP_001167280
Protein GI	146277121
COG category	[S] Function unknown
COG ID	[COG5323] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.541704
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.984253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCGAGT TCTGGGCGCT GCCGCACCAG CTCGCACCGG AGGGCGGGTG GAAGAGCTGG 
GTGGTGATGG GCGGCCGGGG CGCGGGCAAG ACCCGGGCGG GGGCCGAGTG GGTCCGTTCG 
GAGGTCGAGG GCCCGAGGCC CGGAGATCCG GGCCGGTCGC GCCATGTGGC GCTGGTGGGC 
GAGACGGTCG ATCAGACCCG CGAGGTGATG GTCTTCGGCG AGAGCGGCCT GCTGGCCTGC 
TCGCCCCCCG ATCGGCGGCC CGAATGGGAG GCGGGGCGCA AGCGCCTCGT GTGGCCGAAC 
GGGGCGGTGG CGCAGGTGTT TTCGGCCCAC GATCCCGAGA GCCTTCGCGG GCCGCAGTTC 
GACGCCGCCT GGGCCGACGA ACTGGCCAAA TGGGCCCGCG CCGAAGAGGC GTGGGACATG 
CTGCAATTCT CGCTGCGGCT GGGCGATCAG CCGCGGCAGG TGGTGACGAC GACGCCGCGC 
AACGTGCCGG TGCTGCGCCA GATCCTCGAC AACCCCTCGA CGGTGGTCAC GCATGCGCCG 
ACCGAGGCGA ACCGTGCCTA TCTGGCCAAG TCCTTCCTCG ACGAGGTCCA TGCCCGTTAC 
GACGGCACGC GCCTCGGGCG GCAGGAGCTG GAGGGGCTGT TGCTGGAGGA TGTCGAGGGC 
GCGCTCTGGA CCACGGTGCG GATCGAGGCG CTGCGGGCCG AGGAGGCCGG TCCCCTCGAC 
CGGATCGTGG TGGCGGTCGA TCCGCCCGTG ACCGGGCACG AAGCGTCGGA TGAATGCGGC 
ATCGTGGTGG TGGGCGCGCG GACCGACGGC CCGCCTCAGG ATTGGCAGGC GGTCGTGCTC 
GAGGATGCCT CGGTCGGGGC TGCGAGCCCG GATCGCTGGG CACGGGCGGC GCTTGATGCG 
CTGCATCGGC ATGGGGCGGA TCGGCTGGTG GCCGAGGTGA ACCAGGGGGG CGATCTGGTG 
GAAACGGTGA TCCGGCAGAT CGATCCGCTC GTGCCGTTCC GGGCTGTCCA TGCCTCGCGC 
GGGAAGGCGG CGCGGGCGGA ACCGGTTGCC GCGCTCTACG AGCAGGGGCG GGTCCGGCAT 
CTGCGGGGTC TGGGCGATCT CGAGGATCAG ATGTGCCGGA TGACGGTGCG CGGCTACGAC 
GGCCGCGGCT CGCCCGACCG GCTGGATGCG CTGGTCTGGG CGCTGACCGA CCTGATGATC 
GAGCCGGCGC GGGCCTGGGT GAACCCGCGG ATGCGCCTGC TGTAA

Protein sequence

MFEFWALPHQ LAPEGGWKSW VVMGGRGAGK TRAGAEWVRS EVEGPRPGDP GRSRHVALVG 
ETVDQTREVM VFGESGLLAC SPPDRRPEWE AGRKRLVWPN GAVAQVFSAH DPESLRGPQF 
DAAWADELAK WARAEEAWDM LQFSLRLGDQ PRQVVTTTPR NVPVLRQILD NPSTVVTHAP 
TEANRAYLAK SFLDEVHARY DGTRLGRQEL EGLLLEDVEG ALWTTVRIEA LRAEEAGPLD 
RIVVAVDPPV TGHEASDECG IVVVGARTDG PPQDWQAVVL EDASVGAASP DRWARAALDA 
LHRHGADRLV AEVNQGGDLV ETVIRQIDPL VPFRAVHASR GKAARAEPVA ALYEQGRVRH 
LRGLGDLEDQ MCRMTVRGYD GRGSPDRLDA LVWALTDLMI EPARAWVNPR MRLL