Gene EcolC_0035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_0035
Symbol
ID	6068479
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	37576
End bp	38910
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	48%
IMG OID	641599439
Product	xanthine/uracil/vitamin C permease
Protein accession	YP_001723049
Protein GI	170018095
COG category	[R] General function prediction only
COG ID	[COG2252] Permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATG ACAATACCGA TTACGTGAGT AATGAATCAG GGACGCTTTC GCGATTATTT 
AAACTACCTC AGCATGGGAC CACCGTCCGC ACAGAATTGA TTGCGGGGAT GACCACTTTT 
TTAACCATGG TGTACATCGT TTTTGTGAAC CCGCAAATCC TCGGCGCGGC ACAAATGGAC 
CCGAAAGTGG TGTTTGTTAC CACCTGTTTG ATTGCCGGTA TCGGCAGTAT TGCGATGGGG 
ATATTTGCTA ACTTACCCGT GGCGCTGGCT CCGGCAATGG GGCTGAACGC CTTCTTTGCC 
TTCGTGGTCG TGGGGGCGAT GGGCATCTCC TGGCAGACCG GGATGGGCGC AATATTCTGG 
GGCGCAGTTG GACTATTTTT GCTCACGCTG TTTCGTATCC GGTACTGGAT GATCTCCAAC 
ATTCCCTTAA GTTTACGTAT TGGTATCACC AGCGGAATTG GATTATTTAT CGCCTTAATG 
GGATTAAAAA ATACTGGCGT TATTGTCGCC AATAAAGACA CGCTGGTGAT GATTGGCGAT 
TTAAGTTCTC ACGGCGTGTT GTTAGGTATT TTAGGGTTTT TTATTATAAC CGTGTTGTCA 
TCACGTCATT TTCATGCCGC GGTGCTGGTT TCTATTGTGG TGACGTCTTG CTGTGGATTA 
TTTTTCGGTG ATGTTCATTT TAGCGGCGTC TATTCCATTC CGCCTGATAT TAGCGGCGTC 
ATTGGTGAAG TAGATTTGAG CGGCGCGTTA ACACTTGAAC TCGCCGGTAT CATTTTCTCC 
TTTATGCTGA TCAACCTATT TGATTCATCA GGAACATTAA TTGGTGTAAC TGATAAAGCG 
GGCTTAATAG ATGGTAACGG TAAATTCCCC AATATGAATA AGGCGCTGTA TGTTGATAGC 
GTCAGTTCGG TGGCGGGTGC GTTTATCGGC ACCTCGTCTG TTACTGCCTA TATTGAAAGT 
ACTTCTGGTG TGGCAGTCGG TGGCCGCACG GGGCTGACTG CGGTTGTGGT TGGCGTTATG 
TTCCTGTTGG TTATGTTCTT CTCACCGCTG GTGGCGATAG TTCCTCCTTA CGCAACCGCC 
GGAGCGTTAA TCTTTGTTGG CGTGCTGATG ACTTCGAGCC TGGCGCGCGT TAACTGGGAT 
GATTTTACCG AATCGGTGCC TGCGTTTATT ACCACGGTGA TGATGCCCTT TACTTTCTCG 
ATCACCGAAG GGATTGCACT CGGCTTTATG TCGTACTGCA TCATGAAAGT ATGCACCGGG 
CGCTGGCGCG ATCTGAACCT GTGTGTGGTG GTGGTCGCAG CTCTGTTTGC ACTGAAGATT 
ATTCTGGTGG ATTAG

Protein sequence

MNNDNTDYVS NESGTLSRLF KLPQHGTTVR TELIAGMTTF LTMVYIVFVN PQILGAAQMD 
PKVVFVTTCL IAGIGSIAMG IFANLPVALA PAMGLNAFFA FVVVGAMGIS WQTGMGAIFW 
GAVGLFLLTL FRIRYWMISN IPLSLRIGIT SGIGLFIALM GLKNTGVIVA NKDTLVMIGD 
LSSHGVLLGI LGFFIITVLS SRHFHAAVLV SIVVTSCCGL FFGDVHFSGV YSIPPDISGV 
IGEVDLSGAL TLELAGIIFS FMLINLFDSS GTLIGVTDKA GLIDGNGKFP NMNKALYVDS 
VSSVAGAFIG TSSVTAYIES TSGVAVGGRT GLTAVVVGVM FLLVMFFSPL VAIVPPYATA 
GALIFVGVLM TSSLARVNWD DFTESVPAFI TTVMMPFTFS ITEGIALGFM SYCIMKVCTG 
RWRDLNLCVV VVAALFALKI ILVD