Gene ECH74115_2699 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_2699
Symbol	fliD
ID	6970253
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	2534013
End bp	2535410
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	52%
IMG OID	643386560
Product	flagellar capping protein
Protein accession	YP_002271039
Protein GI	209395702
COG category	[N] Cell motility
COG ID	[COG1345] Flagellar capping protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	44
Fosmid unclonability p-value	0.171502
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAGTA TTTCATCGCT GGGAGTCGGG TCAGGTCTGG ATTTAAGTTC AATCCTTGAT 
AGCCTCACCG CCGCGCAAAA AGCGACGCTA ACCCCCATTT CAAATCAGCA ATCGTCGTTT 
ACCGCTAAAC TTAGCGCCTA CGGTACGCTG AAAAGCGCGC TGACGACTTT CCAGACCGCC 
AATACTGCAT TGTCTAAAGC CGATCTTTTT TCCGCCACCA GCAGCACCAC CGCGTTCAGT 
GCCACCACCG CGGGTAACGC CATCGCCGGG AAATACACCA TCAGCGTCAC CCATCTGGCG 
CAGGCGCAAA CCCTGACCAC GCGCACCACC AGAGACGATA CGAAAACGGC GATCGCCACC 
AGCGACAGTA AACTCACCAT TCAACAAGGC GGCGACAAAG ATCCGATTAC CATTGATATC 
AGCGCGGCTA ACTCGTCGTT AAGCGGGATC CGTGATGCCA TCAACAACGC AAAAGCAGGT 
GTTAGCGCGA GCATTATTAA CGTGGGTAAC GGTGATTATC GTCTGTCAGT CACATCAAAT 
GACACCGGCC TTGACAATGC GATGACGCTC TCGGTTAGCG GTGATGATGC GCTACAAAGT 
TTTATGGGCT ATGACGCCAG TGCCAGCAGC AACGGCATGG AGGTCTCGGT CGCCGCCCAG 
AATGCGCAGC TGACGGTCAA CAACGTCGCC ATTGAGAACA GCAGCAACAC CATCAGCGAC 
GCGCTGGAAA ACATCACCCT GAACCTGAAC GATGTCACCA CGGGCAACCA GACGCTAACC 
ATCACTCAGG ACACCTCCAA AGCGCAAACG GCGATTAAAG ATTGGGTGAA TGCCTATAAC 
TCGCTAATAG ATACCTTCAG CAGCCTGACC AAATACACCG CCGTAGATGC GGGAGCTGAT 
AGCCAGAGTT CTAGCAATGG CGCACTGCTC GGCGACTCCA CGCTGCGGAC GATTCAGACG 
CAGTTGAAGT CGATGCTGAG TAATACCGTC AGTTCTTCCA GCTATAAAAC GTTGGCGCAG 
ATTGGTATCA CGACCGATCC CAGCGATGGC AAACTGGAAC TGGATGCCGA CAAACTCACC 
GCTGCACTGA AAAAAGATGC CAGCGGCGTA GGTGCATTGA TTGTTGGCGA TGGTAAAAAA 
ACCGGCATCA CGACCACCAT CGGCAGCAAC CTGACCAGTT GGCTTTCGAC AACGGGCATT 
ATTAAAGCCG CTACCGATGG CGTTAGTAAG ACCCTGAATA AATTAACTAA AGACTACAAC 
GCCGCCAGCG ATCGCATTGA CGCGCAGGTC GCGCGCTACA AAGAACAATT TACCCAACTG 
GACGTTTTAA TGACCTCGTT AAACAGCACA AGCAGCTACT TAACGCAGCA GTTCGAAAAC 
AACAGTAATT CCAAGTAA

Protein sequence

MASISSLGVG SGLDLSSILD SLTAAQKATL TPISNQQSSF TAKLSAYGTL KSALTTFQTA 
NTALSKADLF SATSSTTAFS ATTAGNAIAG KYTISVTHLA QAQTLTTRTT RDDTKTAIAT 
SDSKLTIQQG GDKDPITIDI SAANSSLSGI RDAINNAKAG VSASIINVGN GDYRLSVTSN 
DTGLDNAMTL SVSGDDALQS FMGYDASASS NGMEVSVAAQ NAQLTVNNVA IENSSNTISD 
ALENITLNLN DVTTGNQTLT ITQDTSKAQT AIKDWVNAYN SLIDTFSSLT KYTAVDAGAD 
SQSSSNGALL GDSTLRTIQT QLKSMLSNTV SSSSYKTLAQ IGITTDPSDG KLELDADKLT 
AALKKDASGV GALIVGDGKK TGITTTIGSN LTSWLSTTGI IKAATDGVSK TLNKLTKDYN 
AASDRIDAQV ARYKEQFTQL DVLMTSLNST SSYLTQQFEN NSNSK