Gene Ent638_4035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_4035
Symbol
ID	5110789
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	4388916
End bp	4390076
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	54%
IMG OID	640494260
Product	cystathionine gamma-synthase
Protein accession	YP_001178741
Protein GI	146313667
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR02080] O-succinylhomoserine (thiol)-lyase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.478973
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGCGTA AACAGGCCAC GATCGCAGTG CGTAGCGGAT TGAATGATGA CGAGCAGTAC 
GGCTGCGTTG TCCCGCCGAT TCATCTTTCC AGTACCTATA ATTTCACCGG ATTTAATGAA 
CCTCGTGCGC ATGACTATTC ACGTCGTGGC AACCCGACGC GTGACGTTAC CCAGCGCGCG 
CTGGCGGAAC TCGAAGGCGG CGCAGGTGCG GTTCTGACCA ATACCGGTAT GTCGGCCATT 
CATCTGGTGA CCACGGTATT CCTGAAACCT GGCGATTTGT TGCTCGCTCC ACACGACTGT 
TACGGTGGCA GCTACCGACT TTTTGATAGC CTGGCAAAAC GTGGCTGTTA TCGCGTTCTT 
TTTGTCGATC AAAATGACGA ACAGGCGCTA AAACAAGCAC TTGCCGAAAA GCCTAAGCTC 
GTTCTGGTGG AAAGCCCAAG CAATCCGTTA TTGCGTGTTG TCGATATTGC GAAAATTTGT 
CAGCTCGCAA GGGATGCGGG AGCGATAAGT GTAGTGGATA ATACGTTCCT CAGTCCGGCG 
CTTCAGAACC CACTTTCCCT GGGTGCGGAC CTGGTATTGC ATTCATGCAC GAAATATTTG 
AACGGTCACT CTGACGTGGT CGCGGGCGTG GTGATTGCAA AAGATCCGGA AGTTGTCACC 
GAACTGGCAT GGTGGGCCAA TAACATTGGC GTGACTGCGG GCGCGTTCGA CAGCTATTTG 
CTGCTGCGCG GGATCCGCAC GCTGTCGCCA CGTATGGAAG TGGCACAACG CAATGCCCAG 
GCGATTGTCG ATTTCCTGAA AAACCAGCCG CTGGTGAAAA AGCTGTATCA CCCGTCGTTG 
CCGGAAAACC AGGGCCACGA GATCGCCGCG CGCCAGCAGA AAGGGTTTGG CGCGATGTTA 
AGTTTTGAAC TGGATGGCGA TGAGCAAACG CTGCGTCGCT TCCTGAGTGC GTTGTCACTG 
TTTACGCTGG CGGAATCATT AGGGGGAGTC GAAAGCTTGA TCTCTCACGC CGCAACAATG 
ACACACGCAG GCATGGCGCC AGAAGCGCGT GCCGCCGCCG GGATTTCTGA GACGCTGCTT 
CGCATCTCAA CCGGTATTGA AGACTGTGAA GATTTAATTG CCGATCTGGA AAATGCCTTC 
CAGGTCGCAG CCAAGGGGTA A

Protein sequence

MTRKQATIAV RSGLNDDEQY GCVVPPIHLS STYNFTGFNE PRAHDYSRRG NPTRDVTQRA 
LAELEGGAGA VLTNTGMSAI HLVTTVFLKP GDLLLAPHDC YGGSYRLFDS LAKRGCYRVL 
FVDQNDEQAL KQALAEKPKL VLVESPSNPL LRVVDIAKIC QLARDAGAIS VVDNTFLSPA 
LQNPLSLGAD LVLHSCTKYL NGHSDVVAGV VIAKDPEVVT ELAWWANNIG VTAGAFDSYL 
LLRGIRTLSP RMEVAQRNAQ AIVDFLKNQP LVKKLYHPSL PENQGHEIAA RQQKGFGAML 
SFELDGDEQT LRRFLSALSL FTLAESLGGV ESLISHAATM THAGMAPEAR AAAGISETLL 
RISTGIEDCE DLIADLENAF QVAAKG