Gene Rsph17029_1874 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1874
Symbol
ID	4896597
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1982960
End bp	1984060
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	72%
IMG OID	640112468
Product	OmpA/MotB domain-containing protein
Protein accession	YP_001043750
Protein GI	126462636
COG category	[N] Cell motility
COG ID	[COG1360] Flagellar motor protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.0773204
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGCAA AGCCCAAGGT CATCCGGTTC CAGCCGCCCG TCCCCGACGA CGACGAGGGC 
GAGGACTGCC CGAAATGTCC GCCCCCCGGC GCGCCGGCAT GGCTTGCGAC CTTTGCCGAC 
ATCGCGACCA ACCTCATGGC CTTCTTCGTG CTGATCCTGG GCTTCGCGAA GTTCGACGAG 
CCCTCGTTCA GCAAGATGGC GGGGGCGATG CGGGAGACCT TCGGCTTCCA TTCGATCCGG 
GATGCGACCT CGGGCAACAC GATGATCGAC TTCGGCCTGC CCACCGCCGA TCCCGACGGG 
GCCCAGCCGG ACGAGAAGTC GGACACGGGC GGGTCGGAGG ACGGCGGCGA CGCGGCGGAG 
CGGGTGGCCG AGGCGCTGAA GAAGGCGCTC GAGGACGGCA AGCTGCAGGT GCGCTCGGAC 
GAGGGCGAGG TCGTGATCGA GCTGTCGGGC GAGGACGGAC GGCAGCAGGC GCAGAGCCTC 
GCGCGGGCTC TGGCAGAGAC CGCGGGGCTT GGTCCGCTCC CCGAGCCGCA GACCACGGCC 
CAGCCGCGGC CCGAGCCGAA GGCCGGGCCT GCGGGCCCCG GAGAGGGCAC GGGGGCGCCG 
CCCGGGCCGC CCGTTGGCGG CGACACGGGC GCTGCGCTGC GCCAGTCGGT GCGGGCCGAA 
CTCGATGCGC TCCGGCTGCG CAATGCGCTC GACCGCGAAG TGGCGGAGGG GCTGGTGAAG 
GTGGAGCAGA CCGACGGCAA GGTGTTCGTG AGCCTCGGCG CGGGCGGATC CTTCCCCTCC 
GGCTCCGACG ACCTCACGCC CGATGCGCGC GCGGTCATGG CCCGGATCGC CGAGGCCACG 
CGCAACCCCG AACGCACCAT CACCGTGACG GGCCATACCG ACAATGTCCC CGTGTCGGGC 
GGCGCCTTCC GGGACAATAT CGCGCTCGCC GCCGGGCGCG CCGCAAGCGT GGTGCGCGAG 
CTTGTCGCCT CGGGCAGCGT CGATCCCGGA CGCATCACCG CGGTGAGCCG CGGCGAGTTC 
GACCCGGTGG CGGACAATGC AACCGAGGAA GGCCGGGCGC AGAACCGCCG GATCGAGATC 
GAGATTTCCT ACAAGGACTG A

Protein sequence

MSAKPKVIRF QPPVPDDDEG EDCPKCPPPG APAWLATFAD IATNLMAFFV LILGFAKFDE 
PSFSKMAGAM RETFGFHSIR DATSGNTMID FGLPTADPDG AQPDEKSDTG GSEDGGDAAE 
RVAEALKKAL EDGKLQVRSD EGEVVIELSG EDGRQQAQSL ARALAETAGL GPLPEPQTTA 
QPRPEPKAGP AGPGEGTGAP PGPPVGGDTG AALRQSVRAE LDALRLRNAL DREVAEGLVK 
VEQTDGKVFV SLGAGGSFPS GSDDLTPDAR AVMARIAEAT RNPERTITVT GHTDNVPVSG 
GAFRDNIALA AGRAASVVRE LVASGSVDPG RITAVSRGEF DPVADNATEE GRAQNRRIEI 
EISYKD