Gene Csal_1968 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1968
Symbol	flgL
ID	4027208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	2223146
End bp	2224378
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	62%
IMG OID	637967164
Product	flagellar hook-associated protein FlgL
Protein accession	YP_574019
Protein GI	92114091
COG category	[N] Cell motility
COG ID	[COG1344] Flagellin and related hook-associated proteins
TIGRFAM ID	[TIGR02550] flagellar hook-associated protein 3

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATCA GCACCGTAAC GATGTACGAG CAGGGCGTTT CGGCAATGAA TCGCCAGCAG 
CAGAACTTCA TGGACGTCGG CCAGCAGATC GCGTCCGGCA AGCGGGTGGT GAACCCGTCC 
GACGACCCCC GTGCCGCCGC ACGGGCGGTG AGCGTGTCGC AGTCGCTGGC AGTCAATGCG 
CAGCAGGAAA GCAGCCGGGT GACGGCACGC AATTCGTTGA GCCAGGAAGA GAGCGTCCTC 
AACAGTGTCA GCGATGCCAT CGGCTCGGCC AAGTCCCTGG TCGTGCAGGC CGGTAACGGC 
ACTCTGAGCG ATGCCGATCG CGAATCGCTG GCGTCCGATC TCGAGGGCGC GTTCGAGACG 
CTGGTGGGGC TTGCCAATAC CACCGACGGC AACGGTACTT ACCTGTTCAG CGGCTATCAG 
GACAACGCCA AGGCCTTCTC GCGTACCGAT GCGGGCGATG CTGTCGACAC CATCTCGTAT 
GAAGGCGATC AGGGCGTCAA GCAGCAGAAG ATCGATGCCG AACGCCTCAT GAAGACCAGC 
GATACCGGCA CCGATGTATT CATGCGCTTC TCGGCGGGCA GCGAATATAT CGCCGAAGCC 
GATGAGGGCA ATACGGGAAA CGTGACCTTT TCCGGCCCTG ACGTTCGCGA TGCCGATGCC 
GCCGGTTACG GCGAGACCTT CGACATCAGT TTCAACGGCG ATGGTACCTA TGACATTTCA 
AGCTCCGGGG CGGGGTTTGC CGACCAGACG AACGTTGCCT ACACCGACGG CGAGACCATC 
GAGTTCGGTG GCATGGCGTT GACGCTGGAG GGCGAGCCGG CGGCCGGTGA CTCGTTTACC 
GTCACGCCGG GAGGCGACAT GAGTCAGGAG CAGGCCAGCC TGTTCAAGAC CATCGGCGAT 
ACCATCAATG CCCTGCGTCA GCCCGTCGAG ACCGATGCCG ATCAAGCCGC GCTGGATAAC 
ACGCTGTCCA CCGCGAGCCG CAAGCTGGAT GCCTCGCTGG ACAACGTGCT GACCACGCGG 
GCCTCGGTGG GTGCGCGGAT GAACGAACTG GACGCGCTGG ACGACGTTGG CGGCAACCGC 
GAAATCGCCT ACGAACAGAC GCGTTCCGAT CTCGTCGATC TGGATTACAA CACGGCGATT 
TCCGACTACA TGCTGAGCCA GGTCGGGCTG CAGGCATCGC AGAAATCCTT CGCCGACATT 
CAGCAGATGT CGCTGTTCCA GTTCCTCAAC TGA

Protein sequence

MRISTVTMYE QGVSAMNRQQ QNFMDVGQQI ASGKRVVNPS DDPRAAARAV SVSQSLAVNA 
QQESSRVTAR NSLSQEESVL NSVSDAIGSA KSLVVQAGNG TLSDADRESL ASDLEGAFET 
LVGLANTTDG NGTYLFSGYQ DNAKAFSRTD AGDAVDTISY EGDQGVKQQK IDAERLMKTS 
DTGTDVFMRF SAGSEYIAEA DEGNTGNVTF SGPDVRDADA AGYGETFDIS FNGDGTYDIS 
SSGAGFADQT NVAYTDGETI EFGGMALTLE GEPAAGDSFT VTPGGDMSQE QASLFKTIGD 
TINALRQPVE TDADQAALDN TLSTASRKLD ASLDNVLTTR ASVGARMNEL DALDDVGGNR 
EIAYEQTRSD LVDLDYNTAI SDYMLSQVGL QASQKSFADI QQMSLFQFLN