Gene EcHS_A2041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A2041
Symbol	fliI
ID	5594019
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	2036294
End bp	2037667
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	58%
IMG OID	640921185
Product	flagellum-specific ATP synthase
Protein accession	YP_001458730
Protein GI	157161412
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG1157] Flagellar biosynthesis/type III secretory pathway ATPase
TIGRFAM ID	[TIGR01026] ATPase FliI/YscN family [TIGR03496] flagellar protein export ATPase FliI

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCACGC GCCTGACTCG CTGGCTAACC ACGCTGGATA ACTTCGAAGC TAAAATGGCG 
CAGTTGCCTG CGGTACGTCG CTACGGGCGA TTAACTCGCG CTACCGGGCT GGTGCTGGAA 
GCCACCGGAT TACAATTGCC GCTCGGCGCA ACCTGTGTGA TTGAGCGCCA GAACGGCAGC 
GAAACGCACG AAGTAGAAAG CGAAGTCGTT GGCTTTAACG GTCAACGGCT GTTTTTAATG 
CCGCTGGAGG AAGTGGAAGG TGTCCTGCCC GGCGCGCGTG TTTATGCCAA AAACATTTCG 
GCTGAAGGGC TGCAAAGCGG CAAGCAGTTG CCGCTCGGTC CGGCGTTATT AGGTCGCGTT 
CTGGACGGCA GCGGTAAACC GCTCGATGGC CTCCCCTCCC CCGATACGAC GGAAACCGGT 
GCGCTGATTA CCCCGCCATT TAACCCATTG CAACGTACAC CGATTGAACA TGTGCTGGAC 
ACCGGCGTGC GCCCAATCAA TGCCCTGCTT ACCGTCGGGC GCGGGCAGCG TATGGGGCTG 
TTTGCCGGGT CCGGCGTTGG TAAAAGTGTG CTGCTGGGGA TGATGGCCCG TTACACCCGC 
GCCGATGTCA TTGTCGTGGG TTTGATTGGT GAACGCGGAC GCGAAGTAAA AGATTTTATT 
GAGAATATCC TCGGTGCCGA AGGGCGTGCA CGCTCCGTGG TGATTGCCGC TCCGGCGGAT 
GTTTCTCCGC TTCTGCGAAT GCAAGGTGCC GCCTATGCCA CGCGAATTGC CGAAGATTTT 
CGCGATCGTG GTCAGCATGT ATTGCTGATT ATGGACTCCC TCACCCGCTA CGCGATGGCC 
CAGCGTGAGA TTGCGCTGGC GATTGGCGAA CCACCTGCCA CTAAAGGTTA TCCACCGTCG 
GTGTTTGCCA AATTACCGGC ACTGGTCGAG CGTGCCGGAA ATGGCATTAG CGGCGGCGGC 
TCGATTACCG CGTTTTATAC CGTGCTCACC GAAGGCGATG ACCAGCAGGA CCCCATTGCC 
GACTCCGCGC GGGCCATCCT CGACGGCCAC ATTGTGCTGT CTCGCCGACT GGCGGAAGCC 
GGGCACTATC CGGCTATCGA TATTGAAGCG TCGATCAGTC GCGCAATGAC GGCGTTGATC 
AGTGAGCAAC ATTACGCGCG AGTGCGCACC TTCAAACAGC TGTTGTCGAG TTTTCAGCGT 
AACCGCGATC TGGTTAGCGT CGGCGCGTAT GCCAAAGGCA GCGATCCGAT GCTCGATAAA 
GCCATCGCCC TGTGGCCGCA GCTGGAGGGC TATTTGCAAC AAGGCATTTT TGAACGCGCG 
GACTGGGAAG CGTCTCTCCA GGGGCTGGAG CGTATTTTCC CGACAGTGTC ATAA

Protein sequence

MTTRLTRWLT TLDNFEAKMA QLPAVRRYGR LTRATGLVLE ATGLQLPLGA TCVIERQNGS 
ETHEVESEVV GFNGQRLFLM PLEEVEGVLP GARVYAKNIS AEGLQSGKQL PLGPALLGRV 
LDGSGKPLDG LPSPDTTETG ALITPPFNPL QRTPIEHVLD TGVRPINALL TVGRGQRMGL 
FAGSGVGKSV LLGMMARYTR ADVIVVGLIG ERGREVKDFI ENILGAEGRA RSVVIAAPAD 
VSPLLRMQGA AYATRIAEDF RDRGQHVLLI MDSLTRYAMA QREIALAIGE PPATKGYPPS 
VFAKLPALVE RAGNGISGGG SITAFYTVLT EGDDQQDPIA DSARAILDGH IVLSRRLAEA 
GHYPAIDIEA SISRAMTALI SEQHYARVRT FKQLLSSFQR NRDLVSVGAY AKGSDPMLDK 
AIALWPQLEG YLQQGIFERA DWEASLQGLE RIFPTVS