Gene EcolC_2381 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2381
Symbol
ID	6067523
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2619859
End bp	2620863
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	52%
IMG OID	641601784
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_001725343
Protein GI	170020389
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.643182
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.00000143297
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATGCTG TAACTGAAGG AAGAAAAGTC CTCCTTGAAA TCGCCGATCT TAAAGTGCAC 
TTTGAAATCA AAGATGGCAA ACAGTGGTTC TGGCAACCGC CGAAAACGCT CAAAGCCGTC 
GATGGTGTCA CTCTTCGCCT GTATGAAGGG GAAACATTAG GTGTGGTAGG GGAATCGGGA 
TGCGGTAAGT CCACCTTTGC TCGCGCCATC ATCGGTTTGG TCAAGGCGAC CGACGGTCAT 
GTTGCCTGGT TAGGTAAAGA GTTGCTGGGC ATGAAGCCCG ATGAATGGCG TGCCGTTCGC 
AGTGATATTC AGATGATTTT CCAGGATCCG TTGGCATCGC TAAACCCGCG TATGACCATC 
GGCGAGATCA TCGCTGAACC ACTGCGTACT TATCATCCGA AAATGTCACG CCAGGAAGTT 
CGCGAGCGCG TGAAGGCGAT GATGCTGAAA GTCGGGTTAT TGCCTAACCT GATTAACCGC 
TATCCGCATG AGTGCTCCGG TGGGCAGTGC CAGCGTATCG GGATTGCTCG TGCTCTTATT 
CTTGAACCGA AGCTGATTAT CTGCGATGAG CCGGTGTCGG CGCTGGACGT GTCAATTCAG 
GCGCAGGTGG TCAACCTGCT CCAGCAGCTG CAACGTGAGA TGGGATTGTC ATTAATTTTT 
ATCGCTCATG ACCTGGCCGT GGTAAAACAC ATTTCCGATC GTGTGTTGGT GATGTATCTC 
GGCCATGCGG TAGAACTGGG GACCTATGAT GAGGTCTACC ACAATCCACT ACATCCTTAC 
ACCAAGGCAT TGATGTCGGC AGTCCCCATA CCTGATCCGG ATCTGGAGAA GAACAAAACC 
ATCCAGTTAC TGGAAGGGGA ATTACCGTCG CCGATCAACC CGCCTTCCGG TTGTGTTTTC 
CGTACCCGTT GCCCGATTGC CGGTCCGGAG TGCGCCAAAA CACGTCCTGT TCTGGAGGGG 
AGTTTCAGAC ACGCCGTTTC TTGCCTGAAA GTCGATCCGC TTTAA

Protein sequence

MNAVTEGRKV LLEIADLKVH FEIKDGKQWF WQPPKTLKAV DGVTLRLYEG ETLGVVGESG 
CGKSTFARAI IGLVKATDGH VAWLGKELLG MKPDEWRAVR SDIQMIFQDP LASLNPRMTI 
GEIIAEPLRT YHPKMSRQEV RERVKAMMLK VGLLPNLINR YPHECSGGQC QRIGIARALI 
LEPKLIICDE PVSALDVSIQ AQVVNLLQQL QREMGLSLIF IAHDLAVVKH ISDRVLVMYL 
GHAVELGTYD EVYHNPLHPY TKALMSAVPI PDPDLEKNKT IQLLEGELPS PINPPSGCVF 
RTRCPIAGPE CAKTRPVLEG SFRHAVSCLK VDPL