Gene EcolC_2849 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2849
Symbol
ID	6065167
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	3117419
End bp	3119155
Gene Length	1737 bp
Protein Length	578 aa
Translation table	11
GC content	55%
IMG OID	641602255
Product	ABC transporter related
Protein accession	YP_001725804
Protein GI	170020850
COG category	[V] Defense mechanisms
COG ID	[COG1131] ABC-type multidrug transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.037407
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGATG CCGTTATCAC GCTGAACGGC CTGGAAAAAC GCTTTCCGGG CATGGACAAG 
CCCGCCGTCG CGCCGCTCGA TTGTACCATT CACGCCGGTT ATGTGACGGG GTTGGTGGGG 
CCGGACGGTG CAGGTAAAAC CACGCTGATG CGGATGTTGG CGGGATTACT GAAACCCGAC 
AGCGGCAGTG CCACGGTGAT TGGCTTTGAT CCGATCAAAA ACGACGGCGC GCTGCACGCC 
GTGCTCGGCT ATATGCCGCA GAAATTTGGT CTGTATGAAG ATCTCACGGT GATGGAGAAC 
CTCAATCTGT ACGCGGATTT GCGCAGCGTC ACCGGCGAGG CACGTAAGCA AACTTTTGCT 
CGCCTGCTGG AGTTTACGTC TCTTGGGCCG TTTACCGGAC GCCTGGCGGG CAAGCTCTCC 
GGTGGGATGA AACAAAAACT CGGCCTGGCC TGTACCCTGG TGGGCGAACC GAAAGTGTTG 
CTGCTCGATG AACCCGGCGT CGGCGTTGAC CCTATCTCAC GGCGCGAACT GTGGCAGATG 
GTGCATGAGC TGGCGGGCGA AGGGATGTTA ATCCTCTGGA GTACCTCGTA TCTCGACGAA 
GCCGAGCAGT GCCGTGACGT GTTACTGATG AACGAAGGCG AGTTGCTGTA TCAGGGAGAA 
CCAAAAGCCC TGACACAAAC CATGGCCGGA CGCAGCTTTC TGATGACCAG TCCACACGAG 
GGCAACCGCA AACTGTTGCA ACGCGCCTTG AAACTGCCGC AGGTCAGCGA CGGCATGATT 
CAGGGGAAAT CGGTACGTCT GATCCTCAAA AAAGAGGCCA CACCAGACGA TATTCGCCAT 
GCCGACGGGA TGCCGGAAAT CAACATCAAC GAAACTACGC CGCGTTTTGA AGATGCGTTT 
ATTGATTTGC TGGGTGGTGC CGGAACCTCA GAATCGCCGC TGGGTGCAAT ATTGCATACG 
GTAGAAGGCA CACCCGGCGA GACGGTGATC GAAGCGAAAG AACTGACCAA GAAATTTGGT 
GATTTTGCCG CCACCGATCA CGTCAACTTT GCCGTTAAAC GTGGGGAGAT TTTTGGTTTG 
CTGGGGCCAA ACGGCGCGGG TAAATCGACC ACCTTTAAGA TGATGTGCGG TTTGCTGGTG 
CCGACTTCCG GCCAGGCGCT GGTGCTGGGG ATGGATCTGA AAGAGAGTTC CGGTAAAGCG 
CGCCAGCATC TCGGCTATAT GGCGCAAAAA TTTTCGCTCT ACGGCAACCT GACGGTCGAA 
CAGAATTTAC GCTTTTTCTC TGGTGTGTAT GGCTTACGCG GTCGGGCGCA GAACGAAAAA 
ATCTCCCGTA TGAGCGAGGC ATTTGGCCTG AAAAGTATCG CCTCCCACGC GACCGATGAA 
CTGCCATTAG GTTTTAAACA GCGGCTGGCG CTGGCCTGTT CGCTGATGCA TGAACCGGAC 
ATTCTGTTTC TCGACGAACC AACGTCCGGC GTTGATCCCC TCACTCGCCG CGAATTTTGG 
CTGCATATCA ACAGCATGGT AGAGAAAGGC GTCACGGTGA TGGTCACCAC TCACTTTATG 
GATGAAGCAG AATATTGCGA CCGCATCGGC CTGGTGTACC GTGGGAAATT AATTGCCAGC 
GGCACGCCGG ATGATTTGAA AGCGCAGTCG GCCAACGACG AGCAACCCGA TCCCACCATG 
GAGCAAGCCT TTATTCAGTT GATCCACGAC TGGGATAAGG AGCATAGCAA TGAGTAA

Protein sequence

MNDAVITLNG LEKRFPGMDK PAVAPLDCTI HAGYVTGLVG PDGAGKTTLM RMLAGLLKPD 
SGSATVIGFD PIKNDGALHA VLGYMPQKFG LYEDLTVMEN LNLYADLRSV TGEARKQTFA 
RLLEFTSLGP FTGRLAGKLS GGMKQKLGLA CTLVGEPKVL LLDEPGVGVD PISRRELWQM 
VHELAGEGML ILWSTSYLDE AEQCRDVLLM NEGELLYQGE PKALTQTMAG RSFLMTSPHE 
GNRKLLQRAL KLPQVSDGMI QGKSVRLILK KEATPDDIRH ADGMPEININ ETTPRFEDAF 
IDLLGGAGTS ESPLGAILHT VEGTPGETVI EAKELTKKFG DFAATDHVNF AVKRGEIFGL 
LGPNGAGKST TFKMMCGLLV PTSGQALVLG MDLKESSGKA RQHLGYMAQK FSLYGNLTVE 
QNLRFFSGVY GLRGRAQNEK ISRMSEAFGL KSIASHATDE LPLGFKQRLA LACSLMHEPD 
ILFLDEPTSG VDPLTRREFW LHINSMVEKG VTVMVTTHFM DEAEYCDRIG LVYRGKLIAS 
GTPDDLKAQS ANDEQPDPTM EQAFIQLIHD WDKEHSNE