Gene EcHS_A4172 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcHS_A4172
Symbol	metB
ID	5591648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli HS
Kingdom	Bacteria
Replicon accession	NC_009800
Strand	+
Start bp	4157305
End bp	4158465
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	55%
IMG OID	640923275
Product	cystathionine gamma-synthase
Protein accession	YP_001460734
Protein GI	157163416
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR02080] O-succinylhomoserine (thiol)-lyase

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGCGTA AACAGGCCAC CATCGCAGTG CGTAGCGGGT TAAATGACGA CGAACAGTAT 
GGTTGCGTTG TCCCACCGAT CCATCTTTCC AGCACCTATA ACTTTACCGG ATTTAATGAA 
CCGCGCGCGC ATGATTACTC GCGTCGCGGC AACCCAACGC GCGATGTGGT TCAGCGTGCG 
CTGGCAGAAC TGGAAGGTGG TGCCGGTGCA GTGCTCACCA ATACCGGCAT GTCAGCCATC 
CATCTGGTAA CCACCGTCTT TTTGAAACCT GGCGATTTGC TGGTTGCGCC GCACGACTGC 
TACGGCGGTA GCTATCGCCT GTTCGACAGC CTGGCGAAAC GTGGTTGCTA TCGCGTGTTG 
TTTGTTGATC AAGGCGATGA ACAGGCATTA CGGGCAGCGC TGGCAGAAAA ACCCAAACTG 
GTACTGGTAG AAAGCCCAAG TAATCCATTG TTACGCGTCG TGGATATTGC GAAAATCTGC 
CATCTGGCAA GGGAAGTCGG GGCGGTGAGC GTGGTGGATA ACACCTTCTT AAGCCCGGCA 
TTACAAAATC CGCTGGCATT AGGTGCCGAT CTGGTGTTGC ATTCATGCAC GAAATATCTG 
AACGGTCACT CAGACGTAGT GGCCGGCGTG GTGATTGCTA AAGACCCGGA CGTTGTCACT 
GAACTGGCCT GGTGGGCAAA CAATATTGGC GTGACGGGCG GCGCGTTTGA CAGCTATCTG 
CTGCTACGTG GGTTGCGAAC GCTGGTGCCG CGTATGGAGC TGGCGCAGCG TAACGCGCAG 
GCGATTGTGA AATATCTGCA AACCCAGCCG TTGGTGAAAA AACTGTATCA CCCGTCGCTG 
CCGGAAAATC AGGGGCATGA AATTGCCGCG CGCCAGCAAA AAGGCTTTGG CGCAATGTTG 
AGTTTTGAAC TGGATGGCGA TGAGCAGACG CTGCGTCGTT TCCTGGGCGG GCTGTCGTTG 
TTTACGCTGG CGGAATCATT AGGGGGAGTG GAAAGTTTAA TCTCTCACGC CGCAACCATG 
ACACATGCAG GCATGGCACC AGAAGCGCGT GCTGCCGCCG GGATCTCCGA GACGCTGCTG 
CGTATCTCCA CCGGTATTGA AGATGGCGAA GATTTAATTG CCGACCTGGA AAATGGCTTC 
CGGGCTGCAA ACAAGGGGTA A

Protein sequence

MTRKQATIAV RSGLNDDEQY GCVVPPIHLS STYNFTGFNE PRAHDYSRRG NPTRDVVQRA 
LAELEGGAGA VLTNTGMSAI HLVTTVFLKP GDLLVAPHDC YGGSYRLFDS LAKRGCYRVL 
FVDQGDEQAL RAALAEKPKL VLVESPSNPL LRVVDIAKIC HLAREVGAVS VVDNTFLSPA 
LQNPLALGAD LVLHSCTKYL NGHSDVVAGV VIAKDPDVVT ELAWWANNIG VTGGAFDSYL 
LLRGLRTLVP RMELAQRNAQ AIVKYLQTQP LVKKLYHPSL PENQGHEIAA RQQKGFGAML 
SFELDGDEQT LRRFLGGLSL FTLAESLGGV ESLISHAATM THAGMAPEAR AAAGISETLL 
RISTGIEDGE DLIADLENGF RAANKG