Gene EcolC_1832 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1832
Symbol
ID	6065852
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	2032055
End bp	2033500
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	51%
IMG OID	641601246
Product	putative transporter
Protein accession	YP_001724808
Protein GI	170019854
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1292] Choline-glycine betaine transporter
TIGRFAM ID	[TIGR00842] choline/carnitine/betaine transport

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	0.301874
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTTTTGC TGGCAATGGG ACTGGTGATT TATTTAGCCA CCAGTAAATA CGGCAATATT 
CGTCTTGGCG AAGGAAAACC GGAATACAGC ACGCTCTCCT GGCTGTTTAT GTTTATTTGT 
GCCGGTTTAG GTTCTTCTAC GCTTTATTGG GGGGTTGCTG AATGGGCCTA TTATTATCAA 
ACGCCTGGAT TAAATATCGC ACCGCGTTCA CAACAGGCAC TCGAATTTAG CGTTCCCTAC 
TCTTTCTTCC ACTGGGGCAT CAGCGCCTGG GCAACTTATA CGCTGGCCTC ATTAATCATG 
GCTTATCACT TTCATGTGCG GAAAAACAAA GGTCTGAGCC TTTCCGGCAT TATTGCTGCT 
ATTACCGGCG TTCGCCCGCA AGGCCCATGG GGAAAACTGG TCGATTTGAT GTTCCTGATC 
GCCACTGTCG GCGCACTGAC CATTTCCCTT GTTGTTACCG CAGCAACCTT TACTCGTGGA 
CTTTCCGCGC TGACCGGTTT ACCCGATAAC TTCACCGTGC AGGCATTTGT GATCCTGCTT 
TCCGGCGGCA TTTTTTGCCT AAGCTCGTGG ATTGGTATCA ACAACGGTTT GCAACGTCTG 
AGCAAAATGG TTGGCTGGGG CGCGTTCCTG CTGCCATTAC TGGTGCTGAT TGTCGGCCCA 
ACCGAATTTA TTACCAACAG CATCATCAAT GCCATCGGCC TGACCACGCA AAACTTCCTG 
CAAATGAGCT TATTCACCGA TCCGCTTGGC GATGGTTCAT TTACCCGCAA CTGGACCGTT 
TTCTACTGGC TGTGGTGGAT CTCATACACC CCTGGCGTAG CAATGTTTGT CACCCGCGTT 
TCCCGCGGTC GTAAGATTAA AGAAGTTATC TGGGGACTGA TCCTCGGCAG CACCGTCGGT 
TGCTGGTTCT TCTTTGGCGT AATGGAAAGC TATGCCATTC ATCAGTTTAT CAATGGCGTA 
ATCAACGTCC CACAGGTGCT GGAAACACTG GGCGGCGAAA CAGCTGTGCA GCAAGTTCTG 
ATGTCGTTGC CAGCCGGTAA ATTGTTCCTC GCCGCATACC TGGGCGTGAT GATTATTTTC 
CTTGCCTCGC ATATGGATGC GGTGGCCTAC ACCATGGCTG CGACCAGTAC GCGTAATCTC 
CAGGAAGGTG ACGATCCTGA CCGTGGGCTG CGTCTTTTCT GGTGCGTGGT GATCACTCTG 
ATCCCGCTTT CCATCTTGTT TACCGGTGCT TCGCTGGAAA CGATGAAAAC CACCGTCGTG 
CTCACAGCCC TTCCCTTCCT CGTCATTTTA CTGGTGAAAG TCGGCGGATT TATTCGCTGG 
CTGAAACAGG ATTACGCCGA CATTCCGGCT CATCAAGTTG AACATTATCT CCCGCAGACA 
CCGGTTGAAG CCCTGGAAAA AACGCCAGTG CTCCCTGCGG GAACCGTATT CAAAGGCGAC 
AACTGA

Protein sequence

MVLLAMGLVI YLATSKYGNI RLGEGKPEYS TLSWLFMFIC AGLGSSTLYW GVAEWAYYYQ 
TPGLNIAPRS QQALEFSVPY SFFHWGISAW ATYTLASLIM AYHFHVRKNK GLSLSGIIAA 
ITGVRPQGPW GKLVDLMFLI ATVGALTISL VVTAATFTRG LSALTGLPDN FTVQAFVILL 
SGGIFCLSSW IGINNGLQRL SKMVGWGAFL LPLLVLIVGP TEFITNSIIN AIGLTTQNFL 
QMSLFTDPLG DGSFTRNWTV FYWLWWISYT PGVAMFVTRV SRGRKIKEVI WGLILGSTVG 
CWFFFGVMES YAIHQFINGV INVPQVLETL GGETAVQQVL MSLPAGKLFL AAYLGVMIIF 
LASHMDAVAY TMAATSTRNL QEGDDPDRGL RLFWCVVITL IPLSILFTGA SLETMKTTVV 
LTALPFLVIL LVKVGGFIRW LKQDYADIPA HQVEHYLPQT PVEALEKTPV LPAGTVFKGD 
N