Gene ECH74115_4536 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	ECH74115_4536
Symbol	gltD
ID	6967734
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli O157:H7 str. EC4115
Kingdom	Bacteria
Replicon accession	NC_011353
Strand	+
Start bp	4203317
End bp	4204735
Gene Length	1419 bp
Protein Length	472 aa
Translation table	11
GC content	55%
IMG OID	643388248
Product	glutamate synthase subunit beta
Protein accession	YP_002272683
Protein GI	209399690
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0493] NADPH-dependent glutamate synthase beta chain and related oxidoreductases
TIGRFAM ID	[TIGR01318] glutamate synthase small subunit family protein, proteobacterial

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	67
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAGA ATGTTTATCA ATTTATCGAC CTGCAGCGCG TTGATCCGCC AAAGAAACCG 
CTGAAGATCC GCAAAATTGA GTTTGTTGAA ATTTACGAGC CGTTTTCCGA AGGCCAGGCC 
AAAGCGCAGG CTGACCGCTG CCTGTCGTGC GGCAACCCAT ACTGCGAGTG GAAATGCCCG 
GTACACAACT ACATCCCGAA CTGGCTGAAG CTCGCCAACG AGGGGCGTAT TTTTGAAGCG 
GCAGAACTGT CGCACCAGAC CAACACTCTG CCGGAAGTAT GCGGACGTGT CTGCCCGCAA 
GACCGTCTGT GCGAAGGTTC CTGCACCCTG AACGATGAGT TTGGCGCGGT GACCATCGGC 
AACATTGAGC GTTATATCAA TGATAAAGCG TTCGAAATGG GCTGGCGTCC GGATATGTCC 
GGCGTGAAAC AGACCGGTAA AAAAGTGGCG ATTATCGGCG CAGGTCCGGC AGGTCTGGCG 
TGTGCAGATG TCCTGACGCG CAACGGCGTA CAAGCGGTCG TCTTCGACCG TCACCCGGAA 
ATTGGCGGCT TGCTGACCTT CGGTATTCCG GCTTTCAAAC TGGAAAAAGA GGTAATGACG 
CGCCGCCGTG AAATCTTCAC CGGCATGGGT ATTGAATTCA AACTCAATAC CGAAGTGGGC 
CGCGACGTAC AGCTGGACGA TCTGCTGAGT GATTACGATG CCGTGTTCCT TGGCGTCGGG 
ACTTATCAGT CAATGCGCGG CGGGCTGGAA AACGAAGACG CCGATGGCGT GTACGCAGCG 
CTGCCGTTCC TTATCGCCAA CACCAAACAG TTAATGGGCT TTGGCGAAAC TCGTGAAGAA 
CCGTTCGTCA GCATGGAAGG CAAACGCGTG GTAGTACTTG GCGGTGGCGA TACCGCAATG 
GACTGCGTGC GCACGTCTGT ACGCCAGGGG GCAAAGCACG TTACCTGTGC CTATCGTCGT 
GATGAAGAGA ACATGCCGGG TTCCCGCCGC GAAGTGAAAA ACGCGCGGGA AGAAGGTGTA 
GAGTTCAAAT TCAATGTCCA GCCACTGGGA ATTGAAGTGA ACGGTAACGG CAAAGTCAGC 
GGCGTAAAAA TGGTGCGTAC TGAAATGGGC GAACCGGATG CCAAAGGCCG TCGCCGCGCG 
GAGATCGTGG CAGGTTCCGA ACATATCGTT CCAGCAGATG CGGTGATCAT GGCGTTTGGT 
TTCCGTCCAC ACAGCATGGA ATGGCTGGCA AAACACAGCG TCGAGCTGGA TTCGCAAGGC 
CGCATCATCG CCCCGGAAGG CAGCGACAAC GCTTTCCAGA CCAGCAACCC GAAAATCTTT 
GCTGGCGGCG ATATCGTCCG TGGTTCCGAT CTGGTCGTTA CCGCTATTGC CGAAGGTCGT 
AAGGCGGCAG ACGGCATTAT GAACTGGCTG GAAGTTTAA

Protein sequence

MSQNVYQFID LQRVDPPKKP LKIRKIEFVE IYEPFSEGQA KAQADRCLSC GNPYCEWKCP 
VHNYIPNWLK LANEGRIFEA AELSHQTNTL PEVCGRVCPQ DRLCEGSCTL NDEFGAVTIG 
NIERYINDKA FEMGWRPDMS GVKQTGKKVA IIGAGPAGLA CADVLTRNGV QAVVFDRHPE 
IGGLLTFGIP AFKLEKEVMT RRREIFTGMG IEFKLNTEVG RDVQLDDLLS DYDAVFLGVG 
TYQSMRGGLE NEDADGVYAA LPFLIANTKQ LMGFGETREE PFVSMEGKRV VVLGGGDTAM 
DCVRTSVRQG AKHVTCAYRR DEENMPGSRR EVKNAREEGV EFKFNVQPLG IEVNGNGKVS 
GVKMVRTEMG EPDAKGRRRA EIVAGSEHIV PADAVIMAFG FRPHSMEWLA KHSVELDSQG 
RIIAPEGSDN AFQTSNPKIF AGGDIVRGSD LVVTAIAEGR KAADGIMNWL EV