Gene EcolC_2647 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2647
Symbol
ID	6064666
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2898489
End bp	2900396
Gene Length	1908 bp
Protein Length	635 aa
Translation table	11
GC content	52%
IMG OID	641602054
Product	ABC transporter ATPase component
Protein accession	YP_001725604
Protein GI	170020650
COG category	[R] General function prediction only
COG ID	[COG0488] ATPase components of ABC transporters with duplicated ATPase domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0437839
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000617984
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCATTAA TCAGTATGCA TGGCGCATGG CTGTCGTTCA GCGACGCGCC GCTTCTCGAT 
AACGCAGAAC TGCATATCGA AGATAACGAA CGTGTTTGTC TGGTGGGCCG CAACGGCGCA 
GGCAAATCGA CGTTAATGAA AATCCTCAAC CGTGAACAAG GGCTGGATGA CGGTCGCATT 
ATTTACGAGC AAGATTTGAT TGTAGCGCGT CTGCAACAGG ATCCGCCGCG TAACGTTGAG 
GGTAGCGTTT ATGATTTCGT TGCCGAAGGC ATTGAAGAAC AAGCGGAATA TCTGAAACGC 
TATCACGATA TTTCGCGCCT GGTGATGAAC GACCCGAGCG AGAAAAATCT CAACGAACTG 
GCGAAGGTTC AGGAACAGCT GGATCACCAC AACCTGTGGC AGCTGGAAAA CCGCATCAAC 
GAAGTGCTGG CGCAACTGGG GTTAGATCCT AACGTTGCGC TGTCGTCGCT TTCCGGCGGC 
TGGTTGCGTA AAGCGGCATT AGGACGCGCG CTGGTGAGTA ATCCGCGCGT GCTGTTGCTT 
GATGAACCGA CAAACCACCT GGATATTGAA ACCATCGACT GGCTGGAAGG GTTTTTGAAA 
ACTTTCAACG GGACGATTAT TTTCATCTCC CACGACCGTT CGTTTATCCG CAATATGGCG 
ACGCGCATTG TTGATCTCGA TCGCGGCAAG CTGGTGACCT ATCCAGGGAA TTACGACCAG 
TACCTGCTGG AAAAAGAAGA AGCCCTGCGC GTGGAAGAAT TACAAAATGC CGAGTTCGAT 
CGCAAACTGG CGCAGGAAGA GGTGTGGATC CGCCAGGGGA TCAAAGCACG CCGTACCCGT 
AATGAAGGCC GCGTACGCGC CCTGAAAGCG ATGCGTCGCG AACGTGGTGA ACGTCGCGAA 
GTGATGGGTA CCGCAAAGAT GCAGGTGGAA GAGGCCAGCC GCTCCGGTAA AATCGTTTTC 
GAAATGGAAG ACGTTTGCTA CCAGGTTAAC GGTAAGCAAC TGGTGAAAGA TTTTTCTGCC 
CAGGTTCTAC GTGGCGACAA AATTGCCCTG ATTGGTCCGA ATGGGTGCGG CAAAACCACG 
CTGCTAAAAC TGATGCTCGG TCAGCTTCAA GCGGACAGCG GGCGTATTCA CGTTGGCACC 
AAACTGGAAG TGGCTTATTT CGATCAGCAC CGCGCGGAAC TGGATCCCGA TAAAACGGTG 
ATGGATAACC TTGCCGAAGG TAAGCAAGAG GTGATGGTTA ACGGCAAGCC ACGCCACGTA 
TTGGGCTATT TGCAGGACTT TCTGTTCCAT CCGAAACGGG CGATGACGCC GGTACGTGCG 
CTTTCTGGCG GTGAGCGGAA CCGCTTGCTG CTGGCGCGTT TGTTCCTCAA ACCAAGCAAC 
TTATTGATTC TTGACGAACC GACCAACGAT CTTGATGTCG AAACGCTGGA ACTGCTGGAA 
GAACTGATCG ACAGCTATCA GGGCACGGTA TTGCTGGTTA GCCACGATCG TCAGTTTGTC 
GATAACACCG TTACAGAATG TTGGATCTTC GAAGGCGGCG GTAAAATTGG TCGTTATGTC 
GGCGGTTATC ATGATGCCCG TGGTCAGCAA GAGCAGTATG TGGCGCTCAA ACAGCCTGCG 
GTGAAAAAAA CCGAAGAAGC CGCCGCGGCA AAAGCGGAAA CTGTAAAACG CAGCAGTAGC 
AAACTAAGCT ATAAATTGCA GCGCGAACTG GAGCAGCTAC CGCAATTGCT CGAAGATCTG 
GAGGCGAAGC TGGAAGCCCT ACAGACGCAA GTGGCGGATG CTTCCTTCTT CAGTCAGCCG 
CATGAGCAGA CGCAAAAAGT GCTTGCTGAT ATGGCTGCTG CAGAGCAGGA GCTGGAGCAA 
GCCTTTGAAC GCTGGGAGTA TCTTGAAGCG TTAAAAAATG GTGGCTGA

Protein sequence

MSLISMHGAW LSFSDAPLLD NAELHIEDNE RVCLVGRNGA GKSTLMKILN REQGLDDGRI 
IYEQDLIVAR LQQDPPRNVE GSVYDFVAEG IEEQAEYLKR YHDISRLVMN DPSEKNLNEL 
AKVQEQLDHH NLWQLENRIN EVLAQLGLDP NVALSSLSGG WLRKAALGRA LVSNPRVLLL 
DEPTNHLDIE TIDWLEGFLK TFNGTIIFIS HDRSFIRNMA TRIVDLDRGK LVTYPGNYDQ 
YLLEKEEALR VEELQNAEFD RKLAQEEVWI RQGIKARRTR NEGRVRALKA MRRERGERRE 
VMGTAKMQVE EASRSGKIVF EMEDVCYQVN GKQLVKDFSA QVLRGDKIAL IGPNGCGKTT 
LLKLMLGQLQ ADSGRIHVGT KLEVAYFDQH RAELDPDKTV MDNLAEGKQE VMVNGKPRHV 
LGYLQDFLFH PKRAMTPVRA LSGGERNRLL LARLFLKPSN LLILDEPTND LDVETLELLE 
ELIDSYQGTV LLVSHDRQFV DNTVTECWIF EGGGKIGRYV GGYHDARGQQ EQYVALKQPA 
VKKTEEAAAA KAETVKRSSS KLSYKLQREL EQLPQLLEDL EAKLEALQTQ VADASFFSQP 
HEQTQKVLAD MAAAEQELEQ AFERWEYLEA LKNGG