Gene EcSMS35_4685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4685
Symbol	cycA
ID	6146330
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4782999
End bp	4784402
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	51%
IMG OID	641619501
Product	D-alanine/D-serine/glycine permease
Protein accession	YP_001746609
Protein GI	170682794
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.0000407821
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	61
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAGATC AGGTAAAAGT CGTTGCCGAT GATCAGGCTC CGGCTGAACA GTCGCTACGG 
CGCAATCTCA CAAACCGACA TATTCAGCTT ATTGCCATTG GCGGTGCCAT TGGTACAGGG 
TTGTTTATGG GGTCCGGCAA AACGATTAGC CTTGCCGGGC CGTCGATCAT TTTCGTTTAT 
ATGATCATCG GTTTTATGCT CTTTTTCGTG ATGCGGGCAA TGGGGGAATT GCTGCTTTCG 
AATCTGGAAT ACAAATCTTT TAGTGACTTC GCTTCCGATT TACTCGGGCC GTGGGCAGGA 
TATTTCACCG GCTGGACTTA CTGGTTCTGC TGGGTTGTAA CCGGTATGGC AGACGTGGTT 
GCCATTACCG CCTATGCGCA ATTCTGGTTC CCTGGGCTTT CTGACTGGGT TGCTTCGTTA 
TCCGTGATCA TTCTGTTACT GGTTCTAAAC CTCGCCACGG TAAAAATGTT CGGTGAGATG 
GAGTTCTGGT TTGCGATGAT CAAAATCGTC GCCATCGTGT CGCTGATTGT TGTCGGCCTG 
GTCATGGTGG CGATGCACTT TCAGTCACCG ACCGGTGTGG AAGCATCATT TGCACATTTG 
TGGAATGACG GCGGCTGGTT CCCGAAAGGC TTAAGTGGCT TCTTTGCTGG ATTCCAGATA 
GCGGTTTTCG CTTTCGTAGG GATTGAGCTG GTAGGTACCA CCGCTGCGGA AACCAAAGAT 
CCAGAGAAAT CACTGCCACG CGCGATTAAC TCCATTCCGA TCCGTATCAT TATGTTCTAC 
GTCTTCTCGC TGATTGTGAT TATGTCCGTG ACGCCGTGGA GTTCGGTAGT CCCGGAGAAA 
AGCCCGTTCG TTGAACTGTT TGTGTTGGTA GGTTTGCCTG CGGCTGCCAG CGTGATCAAC 
TTTGTGGTGC TGACCTCTGC GGCGTCTTCC GCTAACAGCG GTGTCTTCTC TACCAGCCGT 
ATGCTGTTTG GTCTGGCCCA GGAAGGTGTG GCACCGAAAG CGTTCGCTAA ACTCTCTAAG 
CGCGCAGTAC CCGCGAAAGG GCTGACCTTC TCTTGTATCT GTCTGCTCGG CGGCGTGGTG 
ATGTTGTATG TGAATCCCAG CGTGATTGGC GCGTTCACGA TGATTACAAC CGTTTCCGCG 
ATTCTGTTTA TGTTTGTCTG GACGATTATC CTTTGCTCGT ACCTGGTGTA TCGCAAACAG 
CGTCCTCATC TGCATGAGAA GTCGATCTAC AAGATGCCAC TCGGCAAGCT GATGTGCTGG 
GTATGTATGG CGTTCTTTGT GTTTGTTCTG GTGTTGTTGA CACTGGAAGA TGACACCCGC 
CAGGCGCTGC TGGTTACCCC GCTGTGGTTT ATCGCGCTGG GGCTGGGCTG GCTGTTTATT 
GGTAAAAAAC GCATGGCGAA GTAA

Protein sequence

MVDQVKVVAD DQAPAEQSLR RNLTNRHIQL IAIGGAIGTG LFMGSGKTIS LAGPSIIFVY 
MIIGFMLFFV MRAMGELLLS NLEYKSFSDF ASDLLGPWAG YFTGWTYWFC WVVTGMADVV 
AITAYAQFWF PGLSDWVASL SVIILLLVLN LATVKMFGEM EFWFAMIKIV AIVSLIVVGL 
VMVAMHFQSP TGVEASFAHL WNDGGWFPKG LSGFFAGFQI AVFAFVGIEL VGTTAAETKD 
PEKSLPRAIN SIPIRIIMFY VFSLIVIMSV TPWSSVVPEK SPFVELFVLV GLPAAASVIN 
FVVLTSAASS ANSGVFSTSR MLFGLAQEGV APKAFAKLSK RAVPAKGLTF SCICLLGGVV 
MLYVNPSVIG AFTMITTVSA ILFMFVWTII LCSYLVYRKQ RPHLHEKSIY KMPLGKLMCW 
VCMAFFVFVL VLLTLEDDTR QALLVTPLWF IALGLGWLFI GKKRMAK