Gene EcolC_3781 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3781
Symbol
ID	6067637
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4136871
End bp	4137893
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	57%
IMG OID	641603194
Product	monosaccharide-transporting ATPase
Protein accession	YP_001726713
Protein GI	170021759
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1172] Ribose/xylose/arabinose/galactoside ABC-type transport systems, permease components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTCAAT CTCTCCCGGA CACTACGCCG CCGAAAAGGC GCTTTCGCTG GCCAACGGGA 
ATGCCGCAGC TGGCGGCACT GTTGCTGGTG CTGCTGGTCG ATAGCCTGGT GGCCCCGCAT 
TTCTGGCAGG TGGTGCTCCA GGATGGGCGT TTATTCGGTA GCCCCATAGA CATTCTTAAC 
CGTGCGGCCC CCGTTGCGCT GTTGGCTATC GGAATGACGC TGGTGATCGC AACAGGTGGG 
ATTGATCTCT CCGTGGGGGC GGTGATGGCT ATCGCCGGAG CCACAACGGC TGCGATGACG 
GTCGCGGGAT TCAGCCTGCC GATTGTTTTG TTAAGCGCCC TGGGCACTGG CATCCTGGCG 
GGATTGTGGA ACGGCATACT GGTAGCGATC CTCAAAATTC AGCCGTTTGT TGCCACCCTG 
ATCCTGATGG TCGCCGGGCG CGGCGTGGCG CAACTGATCA CCTCCGGACA GATCGTCACG 
TTTAACTCGC CGGATCTCTC ATGGTTTGGC AGTGGATCGC TGTTGTTCCT GCCAACGCCG 
GTCATTATCG CGGTGCTGAC GCTTATCCTG TTCTGGCTGT TGACCCGCAA AACGGCGCTG 
GGGATGTTTA TCGAAGCCGT TGGTATCAAC ATTCGGGCGG CAAAAAATGC CGGGGTAAAC 
ACGCGGATCA TCGTCATGCT TACCTACGTG TTGAGCGGGC TGTGTGCGGC GATTGCGGGC 
ATTATCGTGG CGGCGGATAT TCGCGGTGCC GATGCCAATA ACGCCGGGTT ATGGCTGGAG 
CTGGACGCCA TTCTCGCGGT GGTTATTGGC GGCGGATCGC TGATGGGCGG ACGTTTTAAC 
CTACTGCTTT CGGTGGTGGG GGCGCTGATT ATTCAGGGGA TGAACACCGG AATTTTGCTT 
TCGGGCTTTC CGCCAGAGAT GAACCAGGTT GTAAAAGCGG TGGTGGTTCT TTGCGTGCTG 
ATTGTCCAGT CGCAACGCTT TATCAGTCTG ATTAAAGGAG TACGTAGCCG TGATAAAACG 
TAA

Protein sequence

MPQSLPDTTP PKRRFRWPTG MPQLAALLLV LLVDSLVAPH FWQVVLQDGR LFGSPIDILN 
RAAPVALLAI GMTLVIATGG IDLSVGAVMA IAGATTAAMT VAGFSLPIVL LSALGTGILA 
GLWNGILVAI LKIQPFVATL ILMVAGRGVA QLITSGQIVT FNSPDLSWFG SGSLLFLPTP 
VIIAVLTLIL FWLLTRKTAL GMFIEAVGIN IRAAKNAGVN TRIIVMLTYV LSGLCAAIAG 
IIVAADIRGA DANNAGLWLE LDAILAVVIG GGSLMGGRFN LLLSVVGALI IQGMNTGILL 
SGFPPEMNQV VKAVVVLCVL IVQSQRFISL IKGVRSRDKT