Gene EcolC_1878 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1878
Symbol
ID	6067632
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2079451
End bp	2080617
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	56%
IMG OID	641601291
Product	putative ABC transporter solute-binding protein
Protein accession	YP_001724853
Protein GI	170019899
COG category	[R] General function prediction only
COG ID	[COG4134] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000418187
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCCATT GTGGGTGGTT GCTGGGATTG TTATCGCTGT TTTCTCTGGC AACACATGCC 
AGTGACTGGC AAGAAATTAA AAATGAGGCC AAAGGGCAAA CCGTCTGGTT TAACGCCTGG 
GGCGGCGATA CCGCAATTAA CCGCTATCTC GACTGGGTGA GCGGCGAGAT GAAAACCCAT 
TACGCTATAA ACCTGAAGAT TGTCCGTCTG GCGGATGCCG CAGACGCGGT GAAGCGCATT 
CAGACCGAAG CCGCAGCCGG ACGTAAAACG GGCGGCTCGG TGGATCTGCT CTGGGTGAAC 
GGCGAAAACT TCCGCACCTT AAAAGAGGCC AATTTATTAC AAACGGGCTG GGCGGAGACT 
CTGCCCAACT GGCGCTATGT CGACACACAG CTGCCGGTGC GGGAAGATTT TTCTGTGCCG 
ACACAAGGTG CGGAATCGCC CTGGGGCGGC GCACAACTGA CGTTTATCGC CCGCCGCGAT 
GTTACGCCAC AGCCACCACA AACGCCGCAA GCCTTACTGG AGTTTGCTAA AGCCAATCCC 
GGCACGGTTA CCTATCCGCG CCCACCGGAC TTTACCGGCA CGGCGTTTCT TGAACAGTTG 
CTGATTATGC TGACGCCCGA TCCCGCCGCA TTAAAAGAAG CGCCGGACGA TGCGACTTTC 
GCCCGTGTCA CTGTGCCATT GTGGCAATAT CTTGATGTGC TGCATCCGTA TTTGTGGCGC 
GAAGGAAAGG ATTTCCCGCC TTCGCCCGCG CGGATGGATG CTCTGCTGAA AGCCGGCACA 
TTGCGCCTGT CGCTGACCTT TAACCCCGCG CATGCGCAGC AAAAAATCGC CAGCGGCGAT 
TTGCCTGCAA GCAGTTACAG TTTTGGCTTT CGCGAGGGGA TGATTGGCAA CGTGCATTTC 
GTCACCATTC CTGCCAACGC GAATGCCAGT GCTGCGGCGA AGGTAGTTGC CAATTTCCTG 
CTCTCACCCG ATGCGCAACT GCGTAAAGCA GATCCCGCTG TCTGGGGCGA TCCTTCTGTT 
CTCGATCCGC AAAAACTGCC TGACGGGCAG CGCGAATCAT TGCAATCAAG AATGCCGCAG 
GATCTGCCGC CGGTACTGGC TGAACCGCAC GCAGGTTGGG TAAATGCGCT GGAACAAGAA 
TGGCTACACC GTTACGGTAC GCATTAA

Protein sequence

MRHCGWLLGL LSLFSLATHA SDWQEIKNEA KGQTVWFNAW GGDTAINRYL DWVSGEMKTH 
YAINLKIVRL ADAADAVKRI QTEAAAGRKT GGSVDLLWVN GENFRTLKEA NLLQTGWAET 
LPNWRYVDTQ LPVREDFSVP TQGAESPWGG AQLTFIARRD VTPQPPQTPQ ALLEFAKANP 
GTVTYPRPPD FTGTAFLEQL LIMLTPDPAA LKEAPDDATF ARVTVPLWQY LDVLHPYLWR 
EGKDFPPSPA RMDALLKAGT LRLSLTFNPA HAQQKIASGD LPASSYSFGF REGMIGNVHF 
VTIPANANAS AAAKVVANFL LSPDAQLRKA DPAVWGDPSV LDPQKLPDGQ RESLQSRMPQ 
DLPPVLAEPH AGWVNALEQE WLHRYGTH