Gene EcolC_1130 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1130
Symbol
ID	6068018
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	1234562
End bp	1236073
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	56%
IMG OID	641600546
Product	ABC transporter related
Protein accession	YP_001724124
Protein GI	170019170
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1129] ABC-type sugar transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCACGG CAACAGAGGC AGTCCCGGTA GCAAAAGTGG TGGCAGGAAA TAAGCGTTAC 
CCCGGCGTCG TTGCGCTGGA TAACGTTAAC TTCACGCTCA ATAAAGGCGA AGTTCGTGCG 
CTGTTAGGTA AAAACGGCGC GGGCAAATCG ACTCTCATTC GAATGCTTAC CGGCAGCGAA 
CGCCCGGATA GCGGTGATAT CTGGATTGGC GAGACGCGAC TGGAAGGTGA CGAAGCTACG 
TTGACTCGCC GTGCCGCTGA ACTGGGGGTT CGTGCGGTTT ATCAGGAATT AAGTCTGGTG 
GAAGGGCTGA CGGTGGCGGA AAACCTCTGC CTCGGTCAGT GGCCCCGCCG CAACGGCATG 
ATTGATTACC TGCAAATGGC GCAGGATGCC CAACGTTGCT TACAGGCGCT GGGCGTTGAC 
GTTAGTCCTG AACAACTTGT TTCAACGCTA AGCCCGGCGC AAAAGCAGCT GGTGGAAATT 
GCGCGGGTGA TGAAGGGCGA GCCGCGCGTG GTCATTCTTG ATGAACCTAC CAGTTCGCTT 
GCGAGTGCGG AAGTTGAACT GGTGATCAGC GCGGTGAAAA AGATGTCGGC ACTGGGCGTG 
GCGGTGATTT ATGTCAGCCA CCGGATGGAA GAAATTCGCC GCATTGCCTC CTGTGCCACC 
GTTATGCGCG ATGGTCAGGT GGCGGGCGAT GTGATGCTCG AAAACACCTC CACGCATCAT 
ATTGTGTCGC TAATGCTAGG GCGTGATCAC GTTGATATTG CGCCGGTAGC CCCTCAGGAA 
ATTGTGGATC AGGCCGTACT GGAAGTCCGT GCGTTACGCC ATAAGCCCAA GCTGGAGGAT 
ATCAGCTTTA CGCTACGTCG TGGCGAAGTG CTTGGCATTG CTGGCCTGCT GGGGGCAGGG 
CGCAGTGAAT TGCTGAAGGC GATTGTTGGG CTGGAGACGT ATGAACAGGG CGAAATTGTT 
ATCAACGGCG AGAAAATCAT GCGCCCCGAT TACGGCGACA TGCTGAAACG CGGCATTGGC 
TATACGCCAG AAAACCGCAA AGAAGCGGGG ATCATTCCCT GGCTGGGCGT TGACGAAAAT 
ACAGTGCTGA CCAATCGGCA AAAAATCAGC ACCAACGGTG TGCTGCAATG GTCCACCATC 
CGCCGCCTGA CCGAAGAGGT GATGCAGCGG ATGACGGTCA AGGCTGCCAG TAGCGAAACA 
CCCATCGGCA CGCTTTCTGG TGGCAATCAG CAAAAAGTGG TGATCGGTCG TTGGGTCTAT 
GCCGCCAGCC AGATTTTGTT GCTCGACGAG CCAACGCGCG GCGTCGATAT CGAAGCCAAA 
CAGCAGATTT ACCGTATTGT CCGTGAGCTG GCTGCCGAAG GAAAAAGCGT GGTGTTTATC 
TCCAGTGAAG TGGAGGAGTT GCCGCTGGTG TGCGACCGCA TCCTGTTGTT ACAGCACGGT 
ACGTTCTCGC AGGAGTTTCA CTCGCCGGTC AATGTGGATG AGCTGATGTC CGCCATTCTG 
TCTGTGCACT GA

Protein sequence

MFTATEAVPV AKVVAGNKRY PGVVALDNVN FTLNKGEVRA LLGKNGAGKS TLIRMLTGSE 
RPDSGDIWIG ETRLEGDEAT LTRRAAELGV RAVYQELSLV EGLTVAENLC LGQWPRRNGM 
IDYLQMAQDA QRCLQALGVD VSPEQLVSTL SPAQKQLVEI ARVMKGEPRV VILDEPTSSL 
ASAEVELVIS AVKKMSALGV AVIYVSHRME EIRRIASCAT VMRDGQVAGD VMLENTSTHH 
IVSLMLGRDH VDIAPVAPQE IVDQAVLEVR ALRHKPKLED ISFTLRRGEV LGIAGLLGAG 
RSELLKAIVG LETYEQGEIV INGEKIMRPD YGDMLKRGIG YTPENRKEAG IIPWLGVDEN 
TVLTNRQKIS TNGVLQWSTI RRLTEEVMQR MTVKAASSET PIGTLSGGNQ QKVVIGRWVY 
AASQILLLDE PTRGVDIEAK QQIYRIVREL AAEGKSVVFI SSEVEELPLV CDRILLLQHG 
TFSQEFHSPV NVDELMSAIL SVH