Gene EcHS_A4449 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4449
Symbol
ID	5592383
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	-
Start bp	4452428
End bp	4453729
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	45%
IMG OID	640923547
Product	TRAP transporter, DctM subunit
Protein accession	YP_001460988
Protein GI	157163670
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1593] TRAP-type C4-dicarboxylate transport system, large permease component
TIGRFAM ID	[TIGR00786] TRAP transporter, DctM subunit

Plasmid Coverage information

Num covering plasmid clones	48
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATTACT GGTTACCGAT TATTGTGTTA TTTGGTGCCT TCTTTTTTAT GTTGGCATTA 
GGTGTACCTA TTGTTTATGC CATTGGTTTA TCGACACTGG CATCAATTTC CACACAACTC 
GATTTCAACT CAGCATTGAG TGTGGTTTCC CAAAAGTTAG CCTCCGGGTT AGATAGTTTT 
ACGTTGTTGG CAATCCCATT TTTTATCTTG TCTGGCAACA TTATGAACCA TGGAGGAATA 
GCGCGACGAT TAATCAACTT TGCCCGTATT CTCGGCGGTC GTCTGCCAGG CTCACTTGCC 
CACTGTAATA TTCTCGCCAA TATGCTGTTC GGGGCAATTT CTGGTTCAGC CGTGGCTTCG 
GCGGCTGCGA TGGGCGGCGT CATGCATCCG CAACAGGTTA AAGAGGGTTA CGACCCGGCA 
TTCAGTACTG CGGTTAACGT TGCCTCTGCC CCGACGGGTT TGCTTATTCC ACCAAGTAAT 
ACGTTAATCG TCTATTCACT GGTCAGTGGT GGTACTTCTA TTGCCGCACT GTTCCTGGCG 
GGTTATGTTC CGGGAATTTT GCTGGGTCTG GCACTGATGG TAATAGCCGG TATTATCGCG 
GTACGTCGCG GTTATCCAAA GCCAGAACGC CCGACTTTAC GCCAGGCTGG CGTTGCGATA 
TGGATGGCTA TCCCCAGTAT TTTCCTGATT ATTTTAATTA TGGGGGGTGT ATTAAGTGGT 
ATTTTTACCC CGACAGAGGC CTCCGCAATT GCAGTAATTT ATACCCTTTT CCTTGCACTG 
GTTCTTTATC GTGAAATCTC AGTTAAAGAT TTACCTAAAA TATTTCTGGA ATCCGTTATT 
ACCACTGCAA TTGTCTTGTT ATTAATTGGT TCTTCGATGG GTATGTCATG GGCAATGTCA 
AACGCTGACG TTCCCTTCCT GATTCTCGAT TTGCTTAACA CTATTTCTGA CAACCCAATA 
ATAATCCTGC TTATTATCAA TATTATCCTG TTGATTATCG GCACTTTTAT GGATATGACA 
CCGGCGGTAC TGATTTTTAC GCCGATATTT TTACCGGTTG TCACCGAACT GGGCATGGAC 
CCGATTCACT TTGGTATTGT CATGGTACTG AACATGTGTA TCGGTATTTG TACTCCGCCT 
GTAGGCAGTG TGTTATTTGT CGGTTGTAGT GTATCTAAAT TACCGATTAA TAAAATTATC 
AAACCTATGC TGCCATTCTA TGCCGTGATG GTATTGGTGC TGGCAATGGT GACCTATATT 
CCGCAAATCA GTATGGCATT GCCAAGAGCA CTGGGCTACT GA

Protein sequence

MDYWLPIIVL FGAFFFMLAL GVPIVYAIGL STLASISTQL DFNSALSVVS QKLASGLDSF 
TLLAIPFFIL SGNIMNHGGI ARRLINFARI LGGRLPGSLA HCNILANMLF GAISGSAVAS 
AAAMGGVMHP QQVKEGYDPA FSTAVNVASA PTGLLIPPSN TLIVYSLVSG GTSIAALFLA 
GYVPGILLGL ALMVIAGIIA VRRGYPKPER PTLRQAGVAI WMAIPSIFLI ILIMGGVLSG 
IFTPTEASAI AVIYTLFLAL VLYREISVKD LPKIFLESVI TTAIVLLLIG SSMGMSWAMS 
NADVPFLILD LLNTISDNPI IILLIINIIL LIIGTFMDMT PAVLIFTPIF LPVVTELGMD 
PIHFGIVMVL NMCIGICTPP VGSVLFVGCS VSKLPINKII KPMLPFYAVM VLVLAMVTYI 
PQISMALPRA LGY