Gene EcolC_3708 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3708
Symbol
ID	6064898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4058050
End bp	4059426
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	54%
IMG OID	641603126
Product	4-hydroxyphenylacetate transporter
Protein accession	YP_001726646
Protein GI	170021692
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG2223] Nitrate/nitrite transporter
TIGRFAM ID	[TIGR02332] 4-hydroxyphenylacetate permease

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.517033
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGACA CCTCACCTGC CATACCGGAG AGTATCGATC CGGCGAATCA GCATAAAGCG 
CTGACTACCG GACAACAGGC GGTTATTAAG AAGTTGTTTC GCCGCCTGAT CGTCTTTCTG 
TTCGTGCTGT TTATCTTCTC GTTCCTTGAT CGCATCAACA TCGGCTTTGC CGGACTCACG 
ATGGGACGCG ACCTCGGTCT GAGCGCCACC ATGTTTGGCC TCGCTACCAC CCTGTTCTAT 
GCCGCTTATG TCATCTTCGG CATTCCCAGC AACATTATGC TGAGTATTGT CGGTGCGCGG 
CGCTGGATCG CCACCATCAT GGTGCTTTGG GGCATCGCCT CTACTGCCAC CATGTTTGCC 
ACTGGCCCCA CCAGCTTGTA CGTACTGCGT ATACTGGTTG GCATTACCGA AGCCGGCTTT 
CTGCCTGGCA TTCTGCTGTA TTTAACCTTC TGGTTTCCGG CCTACTTCCG CGCCCGTGCC 
AACGCCTTGT TTATGGTTGC AATGCCGGTA ACGACAGCGT TGGGATCGAT CGTTTCCGGC 
TACATTTTGT CGCTGGATGG CGTAATGGCA TTAAAAGGCT GGCAGTGGCT GTTTTTGCTG 
GAAGGCTTCC CGTCGGTATT ACTCGGCGTC ATGGTGTGGT TCTGGCTTGA TGACTCACCG 
GACAAAGCTA AGTGGCTGAC GAAAGAAGAC AAAAAATGCC TGCAAGAGAT GATGGATAAC 
GATCGTCTGA CGCTGGTTCA GCCAGAGGGA GCCATCAGCC ACCATGCCAT GCAACAACGC 
AGCATGTGGC GGGAGATCTT CACTCCGGTG GTGATGATGT ATACCCTGGC GTATTTCTGC 
CTGACCAACA CACTTAGTGC GATCAGCATC TGGACACCGC AGATCCTACA AAGCTTTAAT 
CAAGGCAGCA GTAATATCAC CATCGGCCTG CTGGCCGCCG TACCGCAGAT TTGTACCATT 
CTCGGGATGA TTTACTGGAG CCGTCACTCA GATCGCCGCC AGGAACGAAG GCATCACACC 
GCCCTTCCCT ATTTGTTCGC TGCCGCTGGT TGGTTACTGG CTTCGGCAAC TGATCACAAC 
ATGATCCAGA TGCTGGGGAT CATTATGGCT TCGACCGGAT CATTCAGCGC AATGGCGATT 
TTCTGGACAA CACCGGATCA GTCCATCAGC CTGCGGGCAC GAGCGATCGG TATTGCGGTG 
ATCAACGCCA CTGGCAACAT TGGTTCAGCA TTAAGTCCGT TTATGATCGG CTGGTTGAAA 
GATCTGACCG GCAGCTTTAA CAGTGGATTG TGGTTTGTTG CCGCGCTGCT GGTGATTGGT 
GCGGGGATTA TCTGGGCAAT TCCAATGCAG TCCTCCCGTC CGCGAGCGAC CCCGTAA

Protein sequence

MSDTSPAIPE SIDPANQHKA LTTGQQAVIK KLFRRLIVFL FVLFIFSFLD RINIGFAGLT 
MGRDLGLSAT MFGLATTLFY AAYVIFGIPS NIMLSIVGAR RWIATIMVLW GIASTATMFA 
TGPTSLYVLR ILVGITEAGF LPGILLYLTF WFPAYFRARA NALFMVAMPV TTALGSIVSG 
YILSLDGVMA LKGWQWLFLL EGFPSVLLGV MVWFWLDDSP DKAKWLTKED KKCLQEMMDN 
DRLTLVQPEG AISHHAMQQR SMWREIFTPV VMMYTLAYFC LTNTLSAISI WTPQILQSFN 
QGSSNITIGL LAAVPQICTI LGMIYWSRHS DRRQERRHHT ALPYLFAAAG WLLASATDHN 
MIQMLGIIMA STGSFSAMAI FWTTPDQSIS LRARAIGIAV INATGNIGSA LSPFMIGWLK 
DLTGSFNSGL WFVAALLVIG AGIIWAIPMQ SSRPRATP