Gene EcHS_A0471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A0471
Symbol	brnQ
ID	5591937
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	483383
End bp	484702
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	56%
IMG OID	640919654
Product	branched-chain amino acid transport system II carrier protein
Protein accession	YP_001457239
Protein GI	157159921
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1114] Branched-chain amino acid permeases
TIGRFAM ID	[TIGR00796] branched-chain amino acid uptake carrier

Plasmid Coverage information

Num covering plasmid clones	50
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCCATC AATTAAGATC GCGCGATATC ATCGCTCTGG GCTTTATGAC ATTTGCGTTG 
TTCGTCGGCG CAGGTAACAT TATTTTCCCT CCAATGGTCG GCTTGCAGGC AGGCGAACAC 
GTCTGGACTG CGGCATTCGG CTTCCTCATT ACTGCCGTTG GTCTGCCGGT ACTAACGGTA 
GTGGCGCTGG CAAAAGTTGG CGGCGGTGTT GACAGCCTCA GCACGCCAAT CGGTAAAGTC 
GCTGGCGTAC TGCTGGCAAC GGTTTGTTAC CTGGCGGTGG GGCCGCTTTT CGCTACGCCG 
CGTACAGCTA CCGTTTCCTT TGAAGTGGGG ATTGCGCCGC TGACTGGTGA TTCCGCGCTG 
CCGCTGTTTA TCTACAGCCT GGTCTATTTC GCTATCGTTA TTCTGGTTTC GCTCTATCCG 
GGCAAGCTGC TGGATACCGT GGGCAACTTC CTTGCGCCGC TGAAAATTAT CGCGCTGGTC 
ATCCTGTCTG TTGCCGCGAT TGTCTGGCCG GCGGGTTCTA TCAGCACGGC GACTGAGGCT 
TATCAAAACG CTGCGTTTTC TAACGGCTTC GTTAACGGCT ATCTGACCAT GGATACGCTG 
GGCGCAATGG TGTTTGGTAT CGTTATTGTT AACGCGGCGC GTTCTCGTGG CGTTACCGAA 
GCGCGTCTGC TGACCCGTTA TACCGTCTGG GCTGGCCTGA TGGCGGGTGT TGGTCTGACT 
CTGCTGTACC TGGCGCTGTT CCGTCTGGGT TCAGACAGCG CGTCGCTGGT CGATCAGTCT 
GCAAACGGCG CTGCTATTCT GCATGCTTAC GTTCAGCACA CCTTTGGCGG CGGCGGTAGC 
TTCCTGCTGG CGGCGTTAAT CTTCATCGCC TGCCTGGTAA CGGCAGTTGG CCTGACCTGT 
GCTTGTGCAG AATTCTTTGC CCAGTACGTA CCGCTCTCTT ATCGTACGCT GGTGTTTATC 
CTCGGCGGCT TCTCGATGGT GGTTTCTAAC CTCGGCTTAA GCCAGCTGAT CCAGATCTCC 
GTACCGGTGC TGACCGCTAT TTATCCGCCG TGTATCGCAC TGGTTGTATT AAGTTTTACA 
CGCTCATGGT GGCATAATTC GTCCCGCGTG ATTGCTCCGC CGATGTTTAT CAGCCTGCTT 
TTTGGTATTC TCGACGGGAT CAAAGCATCT GCATTCAGCG ATATCTTACC GTCCTGGGCG 
CAGCGTTTAC CGCTGGCCGA ACAAGGTCTG GCGTGGTTAA TGCCAACAGT GGTGATGGTG 
GTTCTGGCCA TTATCTGGGA TCGCGCGGCA GGTCGTCAGG TGACCTCCAG CGCTCACTAA

Protein sequence

MTHQLRSRDI IALGFMTFAL FVGAGNIIFP PMVGLQAGEH VWTAAFGFLI TAVGLPVLTV 
VALAKVGGGV DSLSTPIGKV AGVLLATVCY LAVGPLFATP RTATVSFEVG IAPLTGDSAL 
PLFIYSLVYF AIVILVSLYP GKLLDTVGNF LAPLKIIALV ILSVAAIVWP AGSISTATEA 
YQNAAFSNGF VNGYLTMDTL GAMVFGIVIV NAARSRGVTE ARLLTRYTVW AGLMAGVGLT 
LLYLALFRLG SDSASLVDQS ANGAAILHAY VQHTFGGGGS FLLAALIFIA CLVTAVGLTC 
ACAEFFAQYV PLSYRTLVFI LGGFSMVVSN LGLSQLIQIS VPVLTAIYPP CIALVVLSFT 
RSWWHNSSRV IAPPMFISLL FGILDGIKAS AFSDILPSWA QRLPLAEQGL AWLMPTVVMV 
VLAIIWDRAA GRQVTSSAH