Gene EcolC_1027 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1027
Symbol	proX
ID	6066751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1116046
End bp	1117038
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	53%
IMG OID	641600440
Product	glycine betaine transporter periplasmic subunit
Protein accession	YP_001724023
Protein GI	170019069
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2113] ABC-type proline/glycine betaine transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.23532
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACATA GCGTACTTTT TGCGACAGCG TTTGCCACGC TTATCTCTAC ACAAACTTTT 
GCTGCCGATC TGCCGGGCAA AGGCATTACT GTTAATCCAG TTCAGAGCAC CATCACTGAA 
GAAACCTTCC AGACGCTGCT GGTCAGTCGT GCGCTGGAGA AATTAGGTTA TACCGTCAAC 
AAACCCAGCG AAGTAGATTA CAACGTTGGC TACACCTCGC TTGCTTCCGG CGATGCAACC 
TTCACCGCCG TGAACTGGAC GCCACTGCAT GACAACATGT ACGAAGCTGC CGGTGGCGAT 
AAGAAATTTT ATCGTGAAGG GGTATTTGTT AACGGCGCGG CACAGGGTTA CCTGATCGAT 
AAGAAAACCG CCGACCAGTA CAAAATCACC AACATCGCAC AACTGAAAGA TCCGAAGATC 
GCCAAACTGT TCGATACCAA CGGCGACGGA AAAGCGGATT TAACCGGTTG TAACCCTGGC 
TGGGGCTGCG AAGGTGCGAT CAACCACCAG CTTGCCGCGT ATGAACTGAC CCATACCGTG 
ACGCATAATC AGGGGAACTA CGCGGCGATG ATGGCCGACA CCATCAGTCG CTACAAAGAG 
GGCAAACCGG TGTTTTACTA CACCTGGACG CCGTACTGGG TGAGTAATGA GCTGAAGCCA 
GGGAAAGATG TGGTCTGGTT GCAGGTGCCG TTCTCCGCAC TGCCGGGCGA TAAAAACGCC 
GATACCAAAC TGCCGAATGG TGCGAATTAT GGCTTCCCGG TCAGCACCAT GCATATCGTT 
GCCAACAAAG CCTGGGCCGA GAAAAACCCG GCAGCAGCGA AACTGTTTGC CATTATGCAG 
TTGCCAGTGG CAGATATTAA CGCCCAGAAC GCCATTATGC ATGACGGCAA AGCCTCAGAA 
GGCGATATTC AGGGCCATGT TGATGGCTGG ATCAAAGCCC ACCAGCAGCA GTTCGATGGC 
TGGGTGAATG AGGCGCTGGC AGCGCAGAAG TAA

Protein sequence

MRHSVLFATA FATLISTQTF AADLPGKGIT VNPVQSTITE ETFQTLLVSR ALEKLGYTVN 
KPSEVDYNVG YTSLASGDAT FTAVNWTPLH DNMYEAAGGD KKFYREGVFV NGAAQGYLID 
KKTADQYKIT NIAQLKDPKI AKLFDTNGDG KADLTGCNPG WGCEGAINHQ LAAYELTHTV 
THNQGNYAAM MADTISRYKE GKPVFYYTWT PYWVSNELKP GKDVVWLQVP FSALPGDKNA 
DTKLPNGANY GFPVSTMHIV ANKAWAEKNP AAAKLFAIMQ LPVADINAQN AIMHDGKASE 
GDIQGHVDGW IKAHQQQFDG WVNEALAAQK