Gene EcolC_2142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_2142
Symbol
ID	6066233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2337794
End bp	2338816
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	49%
IMG OID	641601550
Product	sugar ABC transporter periplasmic subunit
Protein accession	YP_001725109
Protein GI	170020155
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACACTTC ATCGCTTTAA GAAAATCGCC TTACTTAGCG TTCTTGGCAT TGCCGCAATC 
TCTATGAATG TGCAGGCCGC AGAGCGTATT GCATTTATTC CCAAACTGGT TGGCGTGGGA 
TTTTTTACCA GCGGTGGCAA CGGCGCACAA CAAGCGGGTA AAGAGCTGGG CGTTGATGTG 
ACCTACGACG GGCCGACAGA ACCCAGTGTT TCTGGTCAGG TACAGTTGAT TAATAACTTC 
GTCAATCAAG GTTATAACGC CATTATCGTT TCTGCGGTTT CGCCTGATGG CTTGTGTCCG 
GCACTGAAAC GCGCCATGCA ACGTGGTGTG AGAGTGCTGA CCTGGGACTC TGATACTAAA 
CCGGAGTGCC GCTCTTACTA CATTAATCAG GGAACGCCCG CCCAGTTGGG AGGTATGTTG 
GTGGATATGG CGGCGCGTCA GGTGAATAAA GACAAAGCCA AAGTCGCGTT TTTCTACTCA 
AGCCCCACCG TTACGGACCA AAACCAGTGG GTGAAAGAAG CGAAAGCGAA AATCGCCAAA 
GAGCATCCTG GCTGGGAAAT TGTCACTACG CAGTTTGGCT ATAACGATGC CACTAAATCA 
TTACAAACCG CAGAAGGAAT ATTAAAAGCG TATAGCGATC TCGACGCCAT TATCGCCCCC 
GATGCCAACG CCCTGCCCGC TGCCGCACAA GCCGCAGAAA ACTTGAAAAA TGACAAAGTA 
GCGATTGTCG GATTCAGTAC GCCAAACGTG ATGCGTCCAT ATGTGGAACG CGGCACGGTG 
AAAGAATTTG GCCTGTGGGA TGTGGTTCAG CAAGGCAAAA TTTCAGTGTA TGTCGCGGAT 
GCATTATTGA AAAAAGGATC AATGAAAACG GGCGACAAGC TGGATATCCA GGGCGTAGGT 
CAGGTTGAAG TCTCGCCAAA TAGCGTTCAG GGCTATGACT ACGAAGCGGA TGGTAATGGC 
ATCGTACTGT TACCGGAGCG CGTGATATTC AACAAAGAGA ATATCGGCAA ATACGATTTC 
TGA

Protein sequence

MTLHRFKKIA LLSVLGIAAI SMNVQAAERI AFIPKLVGVG FFTSGGNGAQ QAGKELGVDV 
TYDGPTEPSV SGQVQLINNF VNQGYNAIIV SAVSPDGLCP ALKRAMQRGV RVLTWDSDTK 
PECRSYYINQ GTPAQLGGML VDMAARQVNK DKAKVAFFYS SPTVTDQNQW VKEAKAKIAK 
EHPGWEIVTT QFGYNDATKS LQTAEGILKA YSDLDAIIAP DANALPAAAQ AAENLKNDKV 
AIVGFSTPNV MRPYVERGTV KEFGLWDVVQ QGKISVYVAD ALLKKGSMKT GDKLDIQGVG 
QVEVSPNSVQ GYDYEADGNG IVLLPERVIF NKENIGKYDF