Gene Rsph17029_1709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1709
Symbol
ID	4897602
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1801096
End bp	1802325
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	72%
IMG OID	640112302
Product	flagellar hook-associated protein 3
Protein accession	YP_001043591
Protein GI	126462477
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID	[TIGR02550] flagellar hook-associated protein 3

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.718507
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0295245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTCG GAACCACCCT CTTCGCCACG CTTGCCAGCC GCAACTTCTC GCGCCTTCAG 
ACCGAGATCG GCACATTGCA GGCCCGTATC GCCTCGGAGG TGCGCGACCC GCGCCCGTCC 
GCCGATCCCA CCCGCGCGGT GCAGCTCTCG GCCGCGAAGG AGATGGAAGC CACGCTCGGG 
CGCTACGGCG CGAATGCGAG CTCGGCCGCG GATCGGCTGG CCCATGCCGA CGTGGCGCTG 
GGCGAGGTTG CGGCGCGGAT GCGCGAGCTC AAGGATGTCG TGCTGCAGGC AGGAAACCCT 
ACGCTCTCCG ACGAGGGACG GGCCGGTCTG CGGATCGTGG CCGAGTCGGC CCGCGAGGCG 
CTCTTCGCGC TGGCCAACCG CAAGGATGCG ATGGGGCAGG GCCTCTTTGC GGGCTATGCC 
GCGGGTCCGG CCTTCGTGAA GGAGGGCGAT ACGGTCCGGT TCGCGGGCAA CGACGGGCAG 
CCCGTGGCCC AGCTCTCCGA GACGCTGCGC GTGGCCACCA GCCTCGGCGG CGCCGAGGTC 
TTCATGGCGG TGCCGACCGA GGCGGGGCCG CGCAGCGTCT TCGATCTGGC CGACGATCTG 
GTGGCGACCC TGTCGGTGCC GCTGGCACAT TCCAGCCCGC AGCGCAGCGC GGAAGACGCG 
GCGCGGCTTT CTCTGGCGGC CCCTCCGGCC CCGGCCACGG TGCGCTTCAC CCTGACGGGC 
CCGGTGGGCT CGGTCGAGAT CGAGCAGCGG CTGCCGGGCT CGGCCCTTGC CGCCATCAAT 
GCGGCCTCGG CCCAGACCGG CGTCACCGCC ACGGAGGAAC CGGACGGGAC CCTCGTCCTG 
GGCGCCGTGG GCCGCATCAC GGTCTCGGAC ATGAGCCGCA GCGACGACCC GCGCGACGTG 
CTGGCAACCT TCACCAGCGC GGATGACAAG GGCGGCTGGA TCATGCCCGC GCGGTTCGAC 
GCGGCCTCGC TGACCGACGC TTTCGATGCC GCCGTGAGCC ACATGGCCGA GCAGCGGGCC 
CGCGCCGGCG CGCTCGCCGC CTCTGTCGAC ACGCAGGCGG ATGCGATCAG GACCCGGCAG 
ACCCGAATCG CCACTGCCAT CGGCGGGCTC GAGGATCTCG ACGTGGCCGA GGCGGTCACG 
CGGCTGCAGC AGCTTCTCCT GACGCAGGAG GCGGCGCAGC AGACCTATGT CAAGATCGCC 
AACCGCAGCC TGTTCGATTA CCTGCGCTAG

Protein sequence

MTLGTTLFAT LASRNFSRLQ TEIGTLQARI ASEVRDPRPS ADPTRAVQLS AAKEMEATLG 
RYGANASSAA DRLAHADVAL GEVAARMREL KDVVLQAGNP TLSDEGRAGL RIVAESAREA 
LFALANRKDA MGQGLFAGYA AGPAFVKEGD TVRFAGNDGQ PVAQLSETLR VATSLGGAEV 
FMAVPTEAGP RSVFDLADDL VATLSVPLAH SSPQRSAEDA ARLSLAAPPA PATVRFTLTG 
PVGSVEIEQR LPGSALAAIN AASAQTGVTA TEEPDGTLVL GAVGRITVSD MSRSDDPRDV 
LATFTSADDK GGWIMPARFD AASLTDAFDA AVSHMAEQRA RAGALAASVD TQADAIRTRQ 
TRIATAIGGL EDLDVAEAVT RLQQLLLTQE AAQQTYVKIA NRSLFDYLR