Gene EcolC_3798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3798
Symbol
ID	6067262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	4157442
End bp	4158854
Gene Length	1413 bp
Protein Length	470 aa
Translation table	11
GC content	53%
IMG OID	641603211
Product	D-alanine/D-serine/glycine permease
Protein accession	YP_001726730
Protein GI	170021776
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000560112
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.948087
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAGATC AGGTAAAAGT CGTTGCCGAT GATCAGGCTC CGGCTGAACA GTCGCTACGG 
CGCAATCTCA CAAACCGACA TATTCAGCTT ATTGCCATTG GCGGTGCCAT TGGTACGGGG 
TTGTTTATGG GGTCTGGCAA AACGATTAGC CTTGCCGGGC CGTCGATCAT TTTCGTTTAT 
ATGATCATCG GTTTTATGCT CTTTTTCGTG ATGCGGGCAA TGGGGGAATT GCTGCTTTCG 
AATCTGGAAT ACAAATCTTT TAGTGACTTC GCTTCCGATT TACTCGGGCC GTGGGCAGGA 
TATTTCACCG GCTGGACTTA CTGGTTCTGC TGGGTTGTAA CCGGTATGGC AGACGTGGTG 
GCGATCACTG CTTATGCTCA GTTCTGGTTC CCCGATCTCT CCGACTGGGT CGCCTCGCTG 
GCGGTGATAG TGCTGCTGTT GACGCTCAAC CTTGCCACCG TGAAAATGTT CGGTGAGATG 
GAGTTCTGGT TTGCGATGAT CAAAATCGTC GCCATCGTGT CGCTGATTGT CGTCGGCCTG 
GTCATGGTGG CGATGCACTT TCAGTCACCG ACCGGTGTGG AAGCGTCATT CGCGCATTTG 
TGGAATGACG GCGGCTGGTT CCCGAAAGGT TTAAGTGGCT TCTTTGCCGG ATTCCAGATA 
GCGGTTTTCG CTTTCGTGGG GATTGAGCTG GTAGGTACAA CAGCTGCGGA AACCAAAGAT 
CCGGAGAAAT CACTGCCACG CGCGATTAAC TCCATTCCGA TCCGTATCAT TATGTTCTAC 
GTCTTCGCGC TGATTGTGAT TATGTCCGTG ACGCCGTGGA GTTCGGTAGT CCCGGAGAAA 
AGCCCGTTTG TTGAACTGTT CGTGTTGGTA GGGCTGCCTG CTGCCGCAAG CGTGATCAAC 
TTTGTGGTGC TGACCTCTGC GGCGTCTTCC GCTAACAGCG GCGTCTTCTC TACCAGCCGT 
ATGCTGTTTG GTCTGGCGCA GGAAGGTGTG GCACCGAAAG CGTTCGCTAA ACTTTCTAAG 
CGCGCAGTAC CAGCGAAAGG GCTGACCTTC TCCTGCATCT GCCTGCTCGG TGGCGTGGTG 
ATGCTGTATG TGAATCCTAG CGTGATTGGC GCGTTCACGA TGATTACAAC CGTTTCCGCG 
ATTCTGTTTA TGTTCGTCTG GACGATTATC CTTTGCTCGT ACCTGGTTTA CCGCAAACAG 
CGTCCTCATC TGCATGAGAA GTCGATCTAC AAGATGCCGC TCGGCAAGCT GATGTGCTGG 
GTATGTATGG CGTTCTTTGT GTTCGTGGTC GTGTTGCTGA CACTGGAAGA TGACACTCGC 
CAGGCGCTGT TGGTCACCCC GCTGTGGTTT ATCGCACTGG GGCTGGGCTG GTTGTTTATT 
GGTAAGAAGC GGGCTGCTGA ACTGCGGAAA TAA

Protein sequence

MVDQVKVVAD DQAPAEQSLR RNLTNRHIQL IAIGGAIGTG LFMGSGKTIS LAGPSIIFVY 
MIIGFMLFFV MRAMGELLLS NLEYKSFSDF ASDLLGPWAG YFTGWTYWFC WVVTGMADVV 
AITAYAQFWF PDLSDWVASL AVIVLLLTLN LATVKMFGEM EFWFAMIKIV AIVSLIVVGL 
VMVAMHFQSP TGVEASFAHL WNDGGWFPKG LSGFFAGFQI AVFAFVGIEL VGTTAAETKD 
PEKSLPRAIN SIPIRIIMFY VFALIVIMSV TPWSSVVPEK SPFVELFVLV GLPAAASVIN 
FVVLTSAASS ANSGVFSTSR MLFGLAQEGV APKAFAKLSK RAVPAKGLTF SCICLLGGVV 
MLYVNPSVIG AFTMITTVSA ILFMFVWTII LCSYLVYRKQ RPHLHEKSIY KMPLGKLMCW 
VCMAFFVFVV VLLTLEDDTR QALLVTPLWF IALGLGWLFI GKKRAAELRK