Gene EcolC_1467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1467
Symbol
ID	6067246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1617285
End bp	1618874
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	51%
IMG OID	641600887
Product	ABC transporter related
Protein accession	YP_001724457
Protein GI	170019503
COG category	[R] General function prediction only
COG ID	[COG4172] ABC-type uncharacterized transport system, duplicated ATPase component
TIGRFAM ID	[TIGR02323] phosphonate C-P lyase system protein PhnK

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000937636
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.218677
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCAAA CTCTGTTAGC GATTGAAAAT TTGTCGGTGG GTTTTCGCCA TCAGCAAACC 
GTACGTACAG TAGTCAATGA TGTTTCACTA CAGATTGAGG CTGGCGAAAC GCTGGCGCTG 
GTGGGTGAGT CAGGTTCAGG CAAAAGCGTT ACCGCGCTGT CAATTTTACG CCTGCTCCCT 
TCCCCGCCGG TTGAATATCT CTCCGGCGAT ATTCGTTTTC ATGGCGAATC GCTGCTTCAC 
GCCAGCGATC AAACGTTGCG CGGTGTACGC GGTAATAAGA TCGCCATGAT TTTTCAGGAA 
CCGATGGTGT CGTTAAATCC ATTGCATACC CTGGAAAAAC AGCTTTATGA AGTGCTTTCA 
CTCCACCGCG GGATGCGTCG GGAAGCGGCT CGTGGCGAAA TTCTTAACTG CCTTGATCGC 
GTTGGTATCC GCCAGGCGGC AAAACGGCTG ACAGATTATC CGCATCAGCT CTCCGGCGGC 
GAACGGCAGC GGGTGATGAT TGCGATGGCG CTGTTAACGC GACCGGAATT ATTAATTGCC 
GATGAACCGA CCACCGCACT GGACGTCTCT GTCCAGGCGC AGATTTTACA GCTGTTGCGC 
GAACTGCAAG GCGAGCTGAA TATGGGCATG CTGTTTATTA CTCATAACCT CAGCATTGTC 
AGAAAACTGG CCCACCGCGT GGCGGTAATG CAAAACGGTC GCTGTGTCGA GCAAAATTAC 
GCCGCTACGC TATTTGCATC ACCCACTCAT CCTTACACAC AAAAGCTACT CAACAGTGAA 
CCGTCAGGCG ATCCAGTGCC GTTGCCAGAA CCTGCCTCAA CGTTGCTGGA TGTTGAACAG 
CTTCAGGTTG CCTTCCCCAT TCGCAAAGGG ATTTTGAAGC GCATTGTGGA TCATAATGTG 
GTGGTGAAAA ACATCAGTTT TACGCTACGA GCGGGTGAAA CACTGGGTTT AGTGGGCGAG 
TCCGGTTCCG GGAAAAGTAC GACGGGACTG GCGCTGCTGC GACTGATTAA TTCTCAGGGC 
AGCATCATCT TTGACGGTCA GCCACTGCAA AATTTAAATC GCCGCCAGCT GTTACCTATT 
CGTCATCGCA TTCAGGTGGT ATTTCAGGAT CCAAACTCCT CGCTCAACCC ACGACTCAAC 
GTTTTGCAGA TTATTGAGGA AGGCTTACGG GTTCACCAGC CGACGCTTTC TGCCGCACAA 
CGCGAACAAC AAGTGATAGC CGTGATGCAT GAAGTGGGAT TAGATCCTGA AACACGCCAC 
CGTTATCCGG CGGAGTTCTC TGGTGGTCAG CGACAACGTA TTGCGATTGC CAGGGCATTA 
ATTCTTAAGC CCTCGCTGAT CATACTTGAT GAACCGACAT CATCACTCGA CAAAACGGTA 
CAGGCGCAAA TATTGACGCT ATTGAAATCA TTGCAACAAA AGCATCAACT GGCCTATTTG 
TTTATCAGCC ACGATTTGCA CGTTGTCCGC GCGTTATGTC ATCAGGTTAT CATACTGCGA 
CAAGGGGAAG TAGTGGAACA AGGACCGTGC GCGCGCGTGT TTGCCACACC GCAGCAGGAG 
TATACGCGTC AGCTACTGGC GTTGAGCTGA

Protein sequence

MTQTLLAIEN LSVGFRHQQT VRTVVNDVSL QIEAGETLAL VGESGSGKSV TALSILRLLP 
SPPVEYLSGD IRFHGESLLH ASDQTLRGVR GNKIAMIFQE PMVSLNPLHT LEKQLYEVLS 
LHRGMRREAA RGEILNCLDR VGIRQAAKRL TDYPHQLSGG ERQRVMIAMA LLTRPELLIA 
DEPTTALDVS VQAQILQLLR ELQGELNMGM LFITHNLSIV RKLAHRVAVM QNGRCVEQNY 
AATLFASPTH PYTQKLLNSE PSGDPVPLPE PASTLLDVEQ LQVAFPIRKG ILKRIVDHNV 
VVKNISFTLR AGETLGLVGE SGSGKSTTGL ALLRLINSQG SIIFDGQPLQ NLNRRQLLPI 
RHRIQVVFQD PNSSLNPRLN VLQIIEEGLR VHQPTLSAAQ REQQVIAVMH EVGLDPETRH 
RYPAEFSGGQ RQRIAIARAL ILKPSLIILD EPTSSLDKTV QAQILTLLKS LQQKHQLAYL 
FISHDLHVVR ALCHQVIILR QGEVVEQGPC ARVFATPQQE YTRQLLALS