Gene EcolC_3916 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3916
Symbol
ID	6064399
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4302464
End bp	4303966
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	50%
IMG OID	641603330
Product	proline/glycine betaine transporter
Protein accession	YP_001726845
Protein GI	170021891
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID	[TIGR00883] metabolite-proton symporter

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.382911
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGAAAA GGAAAAAAGT AAAACCCATT ACCCTTCGTG ATGTCACCAT TATTGATGAC 
GGTAAACTGC GTAAAGCCAT TACCGCAGCA TCACTGGGTA ATGCAATGGA ATGGTTTGAT 
TTTGGTGTTT ATGGTTTTGT TGCTTACGCA TTAGGTAAAG TTTTTTTCCC GGGGGCTGAC 
CCCAGCGTGC AGATGGTTGC TGCACTTGCC ACTTTCTCCG TTCCCTTTCT GATTCGACCG 
CTTGGCGGGC TCTTCTTTGG TATGTTGGGC GATAAATATG GTCGCCAGAA GATCCTCGCT 
ATCACTATTG TGATTATGTC GATCAGTACG TTCTGTATTG GCTTAATACC GTCCTACGAC 
ACGATTGGTA TTTGGGCACC GATTCTGCTG TTGATCTGTA AGATGGCACA AGGTTTCTCG 
GTCGGCGGTG AATATACCGG GGCGTCGATA TTTGTTGCGG AATACTCCCC TGACCGTAAA 
CGTGGCTTTA TGGGCAGCTG GCTGGACTTC GGTTCTATTG CCGGGTTTGT GCTGGGTGCG 
GGCGTGGTGG TGTTAATTTC GACCATTGTC GGCGAAGCGA ACTTCCTCGA CTGGGGCTGG 
CGTATTCCGT TCTTTATTGC TCTGCCGTTA GGGATTATCG GGCTTTACCT GCGCCATGCG 
CTGGAAGAAA CTCCGGCGTT TCAGCAGCAT GTTGATAAAC TGGAACAGGG CGACCGCGAA 
GGTTTGCAGG ATGGCCCGAA AGTCTCGTTT AAAGAGATTG CCACTAAATA CTGGCGCAGC 
CTGTTGACAT GTATTGGTCT GGTTATTGCC ACCAACGTGA CTTACTACAT GTTGCTGACC 
TATATGCCGA GTTATTTGTC GCATAACCTG CATTACTCCG AAGACCACGG GGTGCTGATT 
ATTATCGCCA TTATGATCGG TATGCTGTTT GTCCAGCCGG TGATGGGCTT GCTGAGTGAC 
CGTTTTGGCC GTCGTCCGTT TGTGCTACTT GGTAGTGTTG CCCTGTTTGT GTTGGCGATC 
CCGGCGTTTA TTCTGATTAA CAGTAACGTC ATCGGTCTGA TTTTTGCCGG GTTACTGATG 
CTGGCGGTGA TCCTTAACTG CTTTACGGGC GTTATGGCTT CTACCTTGCC AGCGATGTTC 
CCGACGCATA TCCGATACAG CGCGCTGGCG GCGGCATTTA ATATTTCGGT GCTGGTTGCC 
GGTCTGACGC CAACGCTGGC GGCCTGGCTG GTCGAAAGCT CGCAGAATCT GATGATGCCT 
GCCTATTACC TGATGGTAGT GGCGGTGGTT GGTTTAATCA CCGGCGTAAC CATGAAAGAG 
ACGGCAAATC GTCCGTTGAA AGGTGCGACA CCGGCGGCGT CAGATATACA GGAAGCGAAG 
GAAATTCTCG TCGAGCATTA CGATAATATC GAGCAGAAAA TCGATGATAT TGACCACGAG 
ATTGCCGATT TGCAGGCGAA ACGTACCCGC CTGGTGCAGC AACATCCGCG AATTGATGAA 
TAA

Protein sequence

MLKRKKVKPI TLRDVTIIDD GKLRKAITAA SLGNAMEWFD FGVYGFVAYA LGKVFFPGAD 
PSVQMVAALA TFSVPFLIRP LGGLFFGMLG DKYGRQKILA ITIVIMSIST FCIGLIPSYD 
TIGIWAPILL LICKMAQGFS VGGEYTGASI FVAEYSPDRK RGFMGSWLDF GSIAGFVLGA 
GVVVLISTIV GEANFLDWGW RIPFFIALPL GIIGLYLRHA LEETPAFQQH VDKLEQGDRE 
GLQDGPKVSF KEIATKYWRS LLTCIGLVIA TNVTYYMLLT YMPSYLSHNL HYSEDHGVLI 
IIAIMIGMLF VQPVMGLLSD RFGRRPFVLL GSVALFVLAI PAFILINSNV IGLIFAGLLM 
LAVILNCFTG VMASTLPAMF PTHIRYSALA AAFNISVLVA GLTPTLAAWL VESSQNLMMP 
AYYLMVVAVV GLITGVTMKE TANRPLKGAT PAASDIQEAK EILVEHYDNI EQKIDDIDHE 
IADLQAKRTR LVQQHPRIDE