Gene EcolC_1269 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_1269
Symbol
ID	6067064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	1387291
End bp	1388289
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	52%
IMG OID	641600684
Product	bile acid:sodium symporter
Protein accession	YP_001724262
Protein GI	170019308
COG category	[R] General function prediction only
COG ID	[COG0385] Predicted Na+-dependent transporter
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000908139
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000128844
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAACTTT TTCGTATCCT CGATCCTTTC ACCTTAACCC TGATCACGGT GGTGTTGCTG 
GCCTCTTTCT TTCCGGCCAG AGGCGATTTC GTCCCCTTCT TTGAAAATCT GACCACCGCA 
GCTATTGCCC TGCTGTTCTT TATGCACGGC GCGAAGTTGT CGCGTGAGGC GATTATTGCT 
GGCGGTGGTC ACTGGCGACT GCATTTGTGG GTAATGTGCA GCACCTTCGT GCTGTTTCCG 
ATTCTGGGTG TACTGTTTGC CTGGTGGAAA CCGGTAAATG TCGACCCGAT GCTCTACTCC 
GGTTTTCTCT ACTTGTGCAT TCTCCCGGCT ACCGTGCAGT CTGCAATCGC CTTCACGTCA 
ATGGCGGGCG GTAACGTCGC GGCAGCGGTT TGTTCTGCGT CGGCATCCAG CCTGCTGGGG 
ATTTTCCTTT CACCATTGCT GGTTGGTCTG GTGATGAATG TTCACGGTGC AGGGGGCAGC 
CTTGAGCAGG TCGGTAAAAT TATGCTGCAA CTGCTGCTGC CGTTTGTGTT GGGGCATCTT 
TCCCGGCCGT GGATTGGTGA CTGGGTGTCG CGCAATAAAA AATGGATTGC GAAAACTGAC 
CAGACGTCCA TTCTGTTGGT GGTTTATACA GCGTTCAGCG AAGCCGTCGT TAATGGTATC 
TGGCATAAAG TTGGCTGGGG ATCATTGCTG TTTATCGTGG TGGTCAGCTG CGTTCTTCTG 
GCTATCGTGA TTGTAGTTAA CGTCTTTATG GCACGCCGAC TGAGCTTCAA TAAGGCAGAT 
GAAATTACTA TCGTCTTTTG TGGTTCGAAA AAGAGTCTGG CAAATGGCAT CCCGATGGCA 
AACATTCTGT TCCCCACATC GGTGATCGGT ATGATGGTGC TGCCCCTGAT GATTTTCCAT 
CAGATCCAAT TGATGGTCTG TGCGGTGCTG GCGCGTCGAT ACAAACGCCA GACCGAACAG 
TTACAGGCGC AGCAGGAAAG CAGCGCCGAT AAAGCTTAA

Protein sequence

MKLFRILDPF TLTLITVVLL ASFFPARGDF VPFFENLTTA AIALLFFMHG AKLSREAIIA 
GGGHWRLHLW VMCSTFVLFP ILGVLFAWWK PVNVDPMLYS GFLYLCILPA TVQSAIAFTS 
MAGGNVAAAV CSASASSLLG IFLSPLLVGL VMNVHGAGGS LEQVGKIMLQ LLLPFVLGHL 
SRPWIGDWVS RNKKWIAKTD QTSILLVVYT AFSEAVVNGI WHKVGWGSLL FIVVVSCVLL 
AIVIVVNVFM ARRLSFNKAD EITIVFCGSK KSLANGIPMA NILFPTSVIG MMVLPLMIFH 
QIQLMVCAVL ARRYKRQTEQ LQAQQESSAD KA