Gene EcolC_3665 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3665
Symbol
ID	6065370
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4013375
End bp	4015042
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	55%
IMG OID	641603080
Product	putative ABC transporter ATP-binding protein
Protein accession	YP_001726603
Protein GI	170021649
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCTCAAT TCGTTTATAC CATGCATCGT GTCGGCAAAG TTGTTCCGCC GAAACGTCAT 
ATTTTGAAAA ACATCTCTCT GAGTTTCTTC CCTGGGGCAA AAATTGGTGT CCTGGGTCTG 
AACGGCGCGG GTAAGTCTAC CCTGCTGCGC ATTATGGCGG GCATTGATAA AGACATCGAA 
GGTGAAGCGC GTCCGCAGCC AGACATCAAG ATTGGTTACC TGCCGCAGGA ACCGCAGCTG 
AACCCGGAAC ACACCGTGCG TGAGTCCATT GAAGAAGCGG TTTCTGAAGT GGTTAACGCC 
CTGAAACGCC TGGATGAAGT GTATGCGCTG TACGCCGATC CGGATGCCGA TTTTGACAAG 
CTGGCCGCTG AACAAGGCCG TCTGGAAGAG ATCATTCAGG CTCACGACGG TCATAACCTG 
AACGTACAGC TGGAGCGTGC GGCGGATGCG CTACGTCTGC CGGACTGGGA CGCGAAAATC 
GCTAACCTCT CCGGTGGTGA GCGTCGTCGC GTAGCGTTGT GCCGCCTGCT GCTGGAAAAA 
CCAGACATGC TGCTGCTCGA CGAACCGACC AACCACCTGG ATGCCGAATC CGTGGCCTGG 
CTGGAACGCT TCCTGCACGA CTTCGAGGGC ACCGTGGTGG CGATTACCCA CGACCGTTAC 
TTCCTCGATA ACGTTGCAGG CTGGATCCTC GAACTTGACC GCGGTGAAGG TATTCCGTGG 
GAAGGCAACT ACTCCTCCTG GCTGGAGCAG AAAGATCAGC GCCTGGCGCA GGAAGCTTCA 
CAAGAAGCGG CGCGTCGTAA GTCGATCGAG AAAGAGCTGG AGTGGGTACG TCAGGGAACT 
AAAGGCCGCC AGTCGAAAGG TAAAGCACGT CTGGCACGCT TTGAAGAGCT GAACAGCACC 
GAATATCAGA AACGTAACGA AACCAACGAA CTGTTTATTC CACCTGGACC GCGTCTGGGC 
GATAAAGTGC TGGAAGTCAG CAACCTGCGT AAATCCTACG GTGATCGCCT GCTGATTGAT 
GACCTGAGCT TCTCGATCCC GAAAGGGGCA ATCGTCGGGA TCATCGGTCC GAACGGCGCG 
GGTAAATCGA CCCTGTTCCG TATGATCTCT GGTCAGGAAC AGCCGGACAG CGGCACCATC 
ACTTTAGGTG AAACGGTGAA ACTGGCATCG GTTGATCAGT TCCGTGACTC AATGGATAAC 
AGCAAAACCG TTTGGGAAGA AGTTTCCGGC GGGCTGGATA TTATGAAGAT CGGCAACACC 
GAGATGCCAA GCCGCGCCTA CGTTGGCCGC TTTAACTTTA AAGGGGTTGA TCAGGGTAAA 
CGCGTTGGTG AACTTTCCGG TGGTGAGCGC GGTCGTCTGC ATCTGGCGAA GCTGCTGCAG 
GTTGGCGGCA ACATGCTGCT GCTCGACGAA CCAACCAACG ACCTGGATAT CGAAACCCTG 
CGCGCGCTGG AAAACGCCCT GCTGGAGTTC CCGGGCTGTG CGATGGTTAT CTCGCACGAC 
CGTTGGTTCC TCGACCGTAT CGCCACGCAC ATCCTGGACT ACCAGGATGA AGGTAAAGTT 
GAGTTCTTCG AAGGTAACTT TACTGAGTAC GAAGAGTACA AGAAACGCAC GCTGGGCGCA 
GACGCACTGG AGCCGAAGCG TATCAAGTAC AAGCGTATTG CGAAGTAA

Protein sequence

MAQFVYTMHR VGKVVPPKRH ILKNISLSFF PGAKIGVLGL NGAGKSTLLR IMAGIDKDIE 
GEARPQPDIK IGYLPQEPQL NPEHTVRESI EEAVSEVVNA LKRLDEVYAL YADPDADFDK 
LAAEQGRLEE IIQAHDGHNL NVQLERAADA LRLPDWDAKI ANLSGGERRR VALCRLLLEK 
PDMLLLDEPT NHLDAESVAW LERFLHDFEG TVVAITHDRY FLDNVAGWIL ELDRGEGIPW 
EGNYSSWLEQ KDQRLAQEAS QEAARRKSIE KELEWVRQGT KGRQSKGKAR LARFEELNST 
EYQKRNETNE LFIPPGPRLG DKVLEVSNLR KSYGDRLLID DLSFSIPKGA IVGIIGPNGA 
GKSTLFRMIS GQEQPDSGTI TLGETVKLAS VDQFRDSMDN SKTVWEEVSG GLDIMKIGNT 
EMPSRAYVGR FNFKGVDQGK RVGELSGGER GRLHLAKLLQ VGGNMLLLDE PTNDLDIETL 
RALENALLEF PGCAMVISHD RWFLDRIATH ILDYQDEGKV EFFEGNFTEY EEYKKRTLGA 
DALEPKRIKY KRIAK