Gene Cphy_3603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cphy_3603
Symbol
ID	5742627
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium phytofermentans ISDg
Kingdom	Bacteria
Replicon accession	NC_010001
Strand	-
Start bp	4450172
End bp	4451374
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	37%
IMG OID	641294713
Product	homoserine dehydrogenase
Protein accession	YP_001560689
Protein GI	160881721
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.00000021314
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGATAG CAGTGTTAGG ATTTGGAACC GTAGGTTCTG GAGTATATGA AGTAATAAAA 
ACAAATTATG AAACTATTAC AAAACGTGCT GGTGAAGTAG TTGACATTAA ATATGTGCTG 
GATTTAAGAG ATTTTCCAGG AAATCCTGTT CAGGATATCA TTACTCATGA TTTTAGTGTA 
ATTGCAAATG ATCCAGAAAT TAAGATTGTT GTTGAAGTTA TGGGTGGTGT AGATCCTGCT 
TATTCTTTTG TGAAGGAAGC CTTATTAAAA GGGAAATCTG TCTGTACTTC CAACAAGGAA 
CTAGTAGCAA AACATGGAGC AGAACTATTG GAGATAGCAA AACAAAAGAA GATTAACTTT 
TTGTTTGAAG CTAGTGTTGG CGGTGGTATA CCGATTATTC GTCCTTTGAA TCAATCCTTA 
ACAGCGGATG AGATCGATGA AATAACAGGT ATCTTGAATG GTACTACAAA CTATATTTTA 
TCAAAGATGA AAACGCAAGG ATCTGAGTTT GCAACCGTTC TTAAGGAGGC TCAAGAGCTT 
GGTTATGCAG AACGTAATCC AGAGGCCGAT GTCGAAGGTT TTGATGCTTG CCGTAAAATT 
GCGATTCTTA CCTCGCTTGC ATATGGAATG CATGTTGATT TCGAACAGAT TTATACTGAA 
GGAATTACGA AGATAACAGC AGAGGATATT AAGTATGCCA ATGCGTTAGA TGCTAGCATT 
AAATTATTAG CGACCAGTAA AAACGTTGAC GGTAAGGTGT ATGCGATGGT TGCTCCTAAG 
ATGATAAACG ATAAGCATCC ATTATTTTCT GTAAATGATG TATTTAACGG AATACTTGTT 
AAAGGAAATT TATTAGGTGA TGTTATGTTC TATGGAAGCG GAGCAGGCAA ACTTCCAACA 
GCAAGTGCAG TTGTTTCTGA TGTTGTAGAT GCAACCAAAC ATATGGGAAT CAACATTATG 
ACATTATGGA GCAGCAAACA TCTAATTCCA GCGGATATGA GTACCTATGA GAGTAAATTC 
TTTGTTCGTG TACCTTTAGG GGAAGAGGAG ACTGCAAAAG AATTATTTAA GATTGCAAAG 
GTTGTTTCAG TACCTGATAT AGACGGAGAG TATGCATTTA TCACGGAGAA GATGACGGAA 
GGAGCTTTTG AAGAGGCAGC GAAGAAGCTA TCGATAATTA ACCGTATTCG TGTGGAATTT 
TAG

Protein sequence

MKIAVLGFGT VGSGVYEVIK TNYETITKRA GEVVDIKYVL DLRDFPGNPV QDIITHDFSV 
IANDPEIKIV VEVMGGVDPA YSFVKEALLK GKSVCTSNKE LVAKHGAELL EIAKQKKINF 
LFEASVGGGI PIIRPLNQSL TADEIDEITG ILNGTTNYIL SKMKTQGSEF ATVLKEAQEL 
GYAERNPEAD VEGFDACRKI AILTSLAYGM HVDFEQIYTE GITKITAEDI KYANALDASI 
KLLATSKNVD GKVYAMVAPK MINDKHPLFS VNDVFNGILV KGNLLGDVMF YGSGAGKLPT 
ASAVVSDVVD ATKHMGINIM TLWSSKHLIP ADMSTYESKF FVRVPLGEEE TAKELFKIAK 
VVSVPDIDGE YAFITEKMTE GAFEEAAKKL SIINRIRVEF