Gene EcolC_3232 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_3232
Symbol
ID	6066769
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	-
Start bp	3538736
End bp	3540055
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	55%
IMG OID	641602647
Product	branched-chain amino acid transport system II carrier protein
Protein accession	YP_001726181
Protein GI	170021227
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1114] Branched-chain amino acid permeases
TIGRFAM ID	[TIGR00796] branched-chain amino acid uptake carrier

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.686325
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000117832
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGACCCATC AATTAAGATC GCGCGATATC ATCGCTCTGG GCTTTATGAC ATTTGCGTTG 
TTCGTCGGCG CAGGTAACAT TATTTTCCCT CCAATGGTCG GCTTACAGGC AGGCGAACAC 
GTCTGGACTG CGGCATTCGG CTTCCTCATT ACTGCCGTTG GCCTGCCGGT ATTAACAGTA 
GTGGCGCTGG CAAAAGTTGG CGGCGGTGTT GACAGCCTCA GCACGCCAAT CGGTAAAGTC 
GCTGGCGTAC TGCTGGCAAC GGTTTGTTAC CTGGCGGTGG GGCCGCTTTT CGCTACGCCG 
CGTACAGCTA CCGTTTCTTT TGAAGTGGGG ATTGCGCCGC TGACGGGTGA TTCCGCGCTG 
CCGCTGTTTA TCTACAGCCT GGTCTATTTC GCTATCGTTA TTCTGGTTTC GCTCTATCCG 
GGCAAGCTGC TGGATACCGT GGGCAACTTC CTTGCGCCGC TGAAAATTAT CGCGCTGGTC 
ATCCTGTCTG TTGCCGCGAT TGTCTGGCCG GCGGGTTCTA TCAGCACGGC GACTGAGGCT 
TATCAAAACG CTGCGTTTTC TAACGGTTTC GTTAACGGCT ATCTGACCAT GGATACGCTG 
GGCGCAATGG TGTTTGGTAT CGTTATTGTT AACGCGGCGC GTTCTCGTGG CGTTACCGAA 
GCGCGCCTAC TGACCCGTTA TACCGTCTGG GCTGGCCTGA TGGCGGGTGT TGGTCTGACT 
CTGCTGTACC TGGCGCTGTT CCGTCTGGGT TCAGACAGCG CGTCGCTGGT CGATCAGTCT 
GCAAACGGCG CTGCTATTCT GCATGCTTAC GTTCAGCACA CCTTTGGCGG CGGCGGTAGC 
TTCCTGCTGG CGGCGTTAAT CTTCATCGCC TGCCTGGTAA CGGCAGTTGG CCTGACCTGT 
GCTTGTGCAG AATTCTTTGC CCAGTACGTA CCGCTCTCTT ATCGTACGCT GGTGTTTATC 
CTCGGCGGCT TCTCGATGGT GGTTTCTAAC CTCGGCTTAA GCCAGCTGAT CCAGATCTCC 
GTACCGGTGC TGACCGCTAT TTATCCGCCG TGTATCGCAC TGGTTGTATT AAGTTTTACA 
CGCTCATGGT GGCATAATTC GTCCCGCGTG ATTGCTCCGC CGATGTTTAT CAGCCTGCTT 
TTTGGTATTC TCGACGGGAT CAAAGCATCT GCATTCAGCG ATATCTTACC GTCCTGGGCG 
CAGCGTTTAC CGCTGGCCGA ACAAGGTCTG GCGTGGTTAA TGCCAACAGT GGTGATGGTG 
GTTCTGGCCA TTATCTGGGA TCGCGCGGCA GGTCGTCAGG TGACCTCCAG CGCTCACTAA

Protein sequence

MTHQLRSRDI IALGFMTFAL FVGAGNIIFP PMVGLQAGEH VWTAAFGFLI TAVGLPVLTV 
VALAKVGGGV DSLSTPIGKV AGVLLATVCY LAVGPLFATP RTATVSFEVG IAPLTGDSAL 
PLFIYSLVYF AIVILVSLYP GKLLDTVGNF LAPLKIIALV ILSVAAIVWP AGSISTATEA 
YQNAAFSNGF VNGYLTMDTL GAMVFGIVIV NAARSRGVTE ARLLTRYTVW AGLMAGVGLT 
LLYLALFRLG SDSASLVDQS ANGAAILHAY VQHTFGGGGS FLLAALIFIA CLVTAVGLTC 
ACAEFFAQYV PLSYRTLVFI LGGFSMVVSN LGLSQLIQIS VPVLTAIYPP CIALVVLSFT 
RSWWHNSSRV IAPPMFISLL FGILDGIKAS AFSDILPSWA QRLPLAEQGL AWLMPTVVMV 
VLAIIWDRAA GRQVTSSAH