Gene ECH74115_1349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_1349
Symbol
ID	6971026
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	-
Start bp	1354702
End bp	1355760
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	50%
IMG OID	643385332
Product	ATP-grasp domain protein
Protein accession	YP_002269827
Protein GI	209399591
COG category	[I] Lipid transport and metabolism
COG ID	[COG0439] Biotin carboxylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.204009
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	52
Fosmid unclonability p-value	0.65425
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAAGA AAATTTGGTT TATGGAAGGT TTATCCTCCC AGCGAGATAT TATTCAGGGG 
GTAAAATCAT TTGCACAAAA AAATAATTTT GCCATTACCG TTTTTGCCTC CCACCGTAAC 
GAAAGAAATG AAATCCTTTC CGTTGCCGAT TATTCTTTGA CTGAACCTGA AGATCCTCAA 
AAACGTCTTC AGTTTATCCA GGAAACCATT CAGACCTACG GCATCCACCA TATTCATACT 
GGCCGTAACA GCCAGTGGTT TGAAGAACAC CGTTCAGCCA TTGAACCGAC CGGTGCCACC 
CTTACTACCG GTGCAACGGG CGTCGACTGG TTAACTCTGG CTGACGAAAA AGTTACTTTT 
GCTCAGTTTA TGGAGCAAAA GGGTCTCCCG GTCGTACCAT CCTGGCGGGT GAATACGCTG 
GCAGAATTAA AGACACACCT CGCGGCCCCG CCGTTCACTG ACAGCCCGGT ATGCGTGAAG 
CCGGTGACGG GTATCTATGG CATGGGATTC TGGCGCTTTG ATGACAGTGC TTCGCCTATG 
GCCGTCTTTA ATCATCCCGA ACATCGTCTG GTCAGTCCGC AACAGTATAT TGCAGCAGCA 
TCAGCTGCTG AGTCGTTTAA ACCCCTTGTT TTGATGCCGT ACCTGCCAGG CCCGGAATTT 
TCCGTCGATA TCCTCGCGGA TAAGGGCGAA ATACTCGCAG CCGTGGGACG CCGTAAGGAA 
GGGGCTATCC AGTATCTGGT AAACGAAGGA AGCGCCTGGG AACTGGCGTG TGACTGCGCC 
CGTGTTATGA AGGCCGACGG GCTGGTGAAT GTTCAGACGC GAAACGATGT GAATGGCAAC 
CCGGTGCTGC TTGAAACCAA CATGCGTCCG TCAGGGGGGG TGGGTTATAC CCTTCACAGC 
GGTGTGAACC TTCCTGGGTT ATTTGCTGCC TTTAAGCTCG GTCTGATGTC TGAAGATATG 
GTACGCCAGA GCGCTAAAAA CACCTTTTCT CCGGTTGCGG TGAGATCCAT TACGGATGTA 
ATTGCATACC CGGAATCACT CTCTAACCTT CTGAATTAA

Protein sequence

MNKKIWFMEG LSSQRDIIQG VKSFAQKNNF AITVFASHRN ERNEILSVAD YSLTEPEDPQ 
KRLQFIQETI QTYGIHHIHT GRNSQWFEEH RSAIEPTGAT LTTGATGVDW LTLADEKVTF 
AQFMEQKGLP VVPSWRVNTL AELKTHLAAP PFTDSPVCVK PVTGIYGMGF WRFDDSASPM 
AVFNHPEHRL VSPQQYIAAA SAAESFKPLV LMPYLPGPEF SVDILADKGE ILAAVGRRKE 
GAIQYLVNEG SAWELACDCA RVMKADGLVN VQTRNDVNGN PVLLETNMRP SGGVGYTLHS 
GVNLPGLFAA FKLGLMSEDM VRQSAKNTFS PVAVRSITDV IAYPESLSNL LN