Gene Rsph17025_1662 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1662
Symbol
ID	5082740
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	1704687
End bp	1705916
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	71%
IMG OID	640483220
Product	flagellin-like protein
Protein accession	YP_001167860
Protein GI	146277701
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.741191
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTTG GAACCACCCT CTTCGCAACC CTCGCCAGCC GGAACTTTGC CCGGATCCAG 
ACCGAGATCG GCGGCTTGCA GGAACGGATC TCGGCCGCAA CGCAGGATCC GCGGCCCTCG 
GCCGATCCCG CCCGCGCCCT GCAACTGTCG GCCGCGCGCG AGGTGCAGGA CGCGCTCTCG 
CGCTTTTCCG TCAATGCCGG GACGGCGGCC GAGCGGCTGG CCCATCTGGA CGTGACGCTG 
GGCGATGTCG CCAGCCATGT GCGCGACCTG AAGGACATCG TCCTCCAGAT GGGCAATGCC 
AGCCTGACGG ACGAGGGCCG GGCGGGCCTG CGCATCGAGG CCGAGGCGCT GCGCGAGGCG 
ATGCTGGCCG CGGCCAACCG CAAGGACGGA ACGGGGCAGG GGCTGTTCTC GGGCTATGCC 
ACGGGCGCGG CCTTCGAAAA GACTGCAACG GGCGTGCGGT TTGCGGGCAA CGCGGGCCAG 
CCGGTCGCGC AGCTGTCCGA GAGCCTGCGC GTGGCCACGA GCCTCGGAGG GAACGAGGTC 
TTCATGACCG TCGAGACCGA AGGAGGCGTC CGCAGCCTGT TCGATCTCGC CGACGATCTG 
GTGGCGGCCC TCTCGCCGCC CATCAGCAAG GCCACCACGT CCCGCACCTC GGTCGGCACG 
GCGAGTCTCT CGATCGAGCC GGTTCAGGGC GAGGCCACGC TGCGCTTCAC CCTGACCGGG 
CCCGGCGGAT CGGCCGAGAT CGAGCAGCGT CTGCCCGGTT CGGTCGAGGA GGCGATCAAC 
GCCGCCGCGG CGACGACCGG CATCACCGCC ACGACGGCTG CGGACGGCTC GCTGCGGCTG 
GCGTCGCTGG GCACGATCGA GCTGTCGGGC ATGAGCCGGA GCGACGGGGC GCGCGAGGTG 
CTGGCGACCC TCACGGATGA ACGGGGCCGC GAGGGCTGGG TGGTGGACAA GCGGTTCGGC 
GCCTCGCCCA TGACGGCCGC CTTCGACGCC GCCATCGGCC ACATGGCCGA GCAGCGGGCG 
CGGGCGGGGT CTCTGGCCGC GAGCGTGGAC AGCCAGATGG AGGCGATCAA GGGGCGCCAG 
ACGCGGATGA CGCAGACGGT GGCCGGGCTC GAGGATCTGG ATGTGGCGGC GGCGGTGACA 
CGGCTTCAGG CGCTTCTGCT GACGCAGGAG GCGGCGCAGC AGACCTATGT GAAGATCGCC 
AGCCGAAGCC TCTTCGACTA TCTGCGCTAG

Protein sequence

MTLGTTLFAT LASRNFARIQ TEIGGLQERI SAATQDPRPS ADPARALQLS AAREVQDALS 
RFSVNAGTAA ERLAHLDVTL GDVASHVRDL KDIVLQMGNA SLTDEGRAGL RIEAEALREA 
MLAAANRKDG TGQGLFSGYA TGAAFEKTAT GVRFAGNAGQ PVAQLSESLR VATSLGGNEV 
FMTVETEGGV RSLFDLADDL VAALSPPISK ATTSRTSVGT ASLSIEPVQG EATLRFTLTG 
PGGSAEIEQR LPGSVEEAIN AAAATTGITA TTAADGSLRL ASLGTIELSG MSRSDGAREV 
LATLTDERGR EGWVVDKRFG ASPMTAAFDA AIGHMAEQRA RAGSLAASVD SQMEAIKGRQ 
TRMTQTVAGL EDLDVAAAVT RLQALLLTQE AAQQTYVKIA SRSLFDYLR