Gene Rsph17025_1669 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17025_1669
Symbol
ID	5082747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17025
Kingdom	Bacteria
Replicon accession	NC_009428
Strand	-
Start bp	1713813
End bp	1715084
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	70%
IMG OID	640483227
Product	flagellar basal body FlaE domain-containing protein
Protein accession	YP_001167867
Protein GI	146277708
COG category	[N] Cell motility
COG ID	[COG1749] Flagellar hook protein FlgE
TIGRFAM ID	[TIGR03506] fagellar hook-basal body proteins

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.456133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCGATCA ACACCGCCCT TTCGGGTCTC TCCGCCGCCC AGCACGATAT TGCCGCCACC 
TCGCACAACA TCGCGAACGT GGGCACCATC GGCTTCCGCG GCAGCCGCGC CGAATTTGCC 
GATGTGTTCA ACTCGTCGCC CTACAGCATC GCCCGGACGG CGGTGGGATC GGGCGTGCAG 
ACCCTGCGCA CCGCGATGCA GTTCAGCCAG GGCTCGGTCG TGGCCACGGG CAACACGCTC 
GACCTCGCCA TCGAGGGGCA GGGCTTCTTT GCCACCGAGC CCGCCGTGGG CCCGAACTCG 
GCCAAGCCCG AGCCGATCTA CACGCGCGCG GGCGCCTTCG GGCTGAACGA CAAGGGGGTG 
GCGGTCAATG CCTCGGGGCA GAAGCTGCTC GCCTGGCCCG TGAGCGTCGA GGGCGACGCG 
CTGAGCCAGG TGCCGGGCAC GGCCGTGCCC CTCACCATCC CGCTCACGAT GGGCTCGCCG 
GTCGGCACCA AGGCCGTCAG GATGACGGTG GACCTGCCGA CGGATGACGC CATGCTGGGC 
CAGCAGGCGG CGGTGCCTCC GGCTGCGGCC TTCGACGCGG CCGACCCCAC CACCTATGCC 
GCCGTCACGG CGATCCCGGT CTTCGATGCG AAGGGCAATG CGGTCGAGGC GGCGGCCTAT 
TTCATCAAGA CCGAGAACCC CGCGGCGGGC AGCCCGGACA CGGGCTGGGC GGTGCGGCTC 
GTCGTCGCCG GCGAGACGCT GACGCCGGCC GAGGGCGATC TCGCCTTTGA CGCGACCGGC 
GCGCTGGCCG GGGGCACCGG CAGCCTCAGC TTCACCACCG GCATCGGCAC GCCCTACACG 
CTCGATCTGA CCGGCACCGC GCTGACCAAC CGCAGCTTCG AGGTCAACAC CGTCAACCAG 
GACGGCAAGA GCGCGGCCGC GCTGACCAGC CTCGAGGTGG ATGCCAGCGG CACGGTCTGG 
GCGGCCTACG GCGCCGGCGA CTCCGTCGCC ATGGGGCAGG TGGTGCTGGT GACCTTCGCC 
AACCCGCAGG CGCTGCGCCA GCTCGGCGCC TCGGGCTTCG CGGCCACCGC CGATTCCGGC 
CAGCCCGTCG CGGGCACGGC GGGCGACTCG GGCTTCGGGA TCATCCGGGC CGGCGCGCTC 
GAACATGCCA ACGTCGATCT GACCGAGGAA CTCGTCCATC TGATCACCGC GCAGCGCAAC 
TACCAGGCCT CGGCCAAGGC GATGGAGACC TCGAACTCGC TGATGCAGAC GATCATGAAC 
ATCCGCAGCT GA

Protein sequence

MSINTALSGL SAAQHDIAAT SHNIANVGTI GFRGSRAEFA DVFNSSPYSI ARTAVGSGVQ 
TLRTAMQFSQ GSVVATGNTL DLAIEGQGFF ATEPAVGPNS AKPEPIYTRA GAFGLNDKGV 
AVNASGQKLL AWPVSVEGDA LSQVPGTAVP LTIPLTMGSP VGTKAVRMTV DLPTDDAMLG 
QQAAVPPAAA FDAADPTTYA AVTAIPVFDA KGNAVEAAAY FIKTENPAAG SPDTGWAVRL 
VVAGETLTPA EGDLAFDATG ALAGGTGSLS FTTGIGTPYT LDLTGTALTN RSFEVNTVNQ 
DGKSAAALTS LEVDASGTVW AAYGAGDSVA MGQVVLVTFA NPQALRQLGA SGFAATADSG 
QPVAGTAGDS GFGIIRAGAL EHANVDLTEE LVHLITAQRN YQASAKAMET SNSLMQTIMN 
IRS