Gene Csal_1975 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1975
Symbol
ID	4027215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2230827
End bp	2231990
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	58%
IMG OID	637967171
Product	flagellar basal body FlaE
Protein accession	YP_574026
Protein GI	92114098
COG category	[N] Cell motility
COG ID	[COG1749] Flagellar hook protein FlgE
TIGRFAM ID	[TIGR03506] fagellar hook-basal body proteins

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTTTTT CACAATCATT GAGCGGGGTC AACGCGGCCT CCTCTCAACT GGACACCATC 
GGCAACAATA TCGCCAACTC GCAGACCGTG GGCTTCAAGA GCTCCTCGGT GCAGTTCGCG 
GATATCTTCG CCAATAGCCA GGGCCTCGGC ACACGTGTCG CGGGCAAGCT TCAGGATTTC 
GGTACCGGCA GTCTGGAAAC CACCGGCCGC GGTCTCGACC TGGCCATCGC CGGGGACGGC 
TTCTTCCAGT TCACCCAGAA CGAACAACTG GCCTACTCGC GCAACGGCCA GCTCAGCATG 
AGCGCCGACG GCTACTTCGA GAATGCCCAG GGTGCGCGTT TGACCGATCA GCAAGGCGAG 
CCGCTGCAGG TCACACAGTT CAGCCAGGGG GCTCAGGCGA CGACTGGCGT GGAGACAGCA 
TTCAACCTGA ATGCCGAGAC TGAGGCGCTT GCACCCAATA ATTTTAATCA AGACCAAAGC 
GATACCTATA GCTACGTAAC CAATGCCGGT ACCGTCTATG ACTCCCTGGG CGTCGCACAC 
GACATGAGTC TTTATTATAC GAAGACGGGT GAAAATGACT GGGAGGTTCG AGCTGCACTC 
GATGGTGAGA TGGCTGATGG TGGTGCCGCG CAATCCATAA GCTTTAATGA AAGTGGTGTT 
CCTGACGTTG ATACTGCCTT GAGCTTTAAC TTCGGCGACT TGGGAAATGG GTCAGCCGAC 
TTCGATAATA TTGAGGTCGA TTTGGCAGGG ACTACCCAGT ATGGCGAAGC TTTCGAGCTG 
AGGGAGTTCG CTCAGGACGG TAATGCTTCC GGTACCTTCG TGGGCGTGGA AATCACCGAG 
AACGGTGAAG TCCTGGCCAA TTACTCCAAC GGCAACAGTG AAGCGGTCGG TACCGTCGGC 
ATGGCCAACT TCCGCAACCC GGAAGGCCTG GAGCCTCAGG GCGACAACCT GTGGGCGGCG 
ACCCAGGAAT CCGGCGCGGC CCTGCTGGGA CAGGCAGGTA CCGGTCAGCT GGGCAGCCTG 
GAATCGGGCA CGCTGGAGGC CTCCAACGTG GACCTGACCC AGGAACTGGT CGACATGATC 
ATCGCGCAGC GCAATTTCCA GGCCAACAAC AACGCCATCC AGACTCAGTC CGACATTCTG 
GAAACGGTCA CCAACTTGCG TTAA

Protein sequence

MGFSQSLSGV NAASSQLDTI GNNIANSQTV GFKSSSVQFA DIFANSQGLG TRVAGKLQDF 
GTGSLETTGR GLDLAIAGDG FFQFTQNEQL AYSRNGQLSM SADGYFENAQ GARLTDQQGE 
PLQVTQFSQG AQATTGVETA FNLNAETEAL APNNFNQDQS DTYSYVTNAG TVYDSLGVAH 
DMSLYYTKTG ENDWEVRAAL DGEMADGGAA QSISFNESGV PDVDTALSFN FGDLGNGSAD 
FDNIEVDLAG TTQYGEAFEL REFAQDGNAS GTFVGVEITE NGEVLANYSN GNSEAVGTVG 
MANFRNPEGL EPQGDNLWAA TQESGAALLG QAGTGQLGSL ESGTLEASNV DLTQELVDMI 
IAQRNFQANN NAIQTQSDIL ETVTNLR