Gene Bind_1038 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1038
Symbol
ID	6201851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	1190599
End bp	1191825
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	60%
IMG OID	641705030
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_001832170
Protein GI	182678024
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCAGGATT TCAAGCCGCC GCGTGATCCA GAAGGCTGGC GGACGGCGAC CCGGCTCGTT 
CATGGTGGAA CGACGCGTTC CCCTTTCGGT GAAACCGCCG AAGCGATCTT TTTGACCCAG 
GGCTATGTCT ATCCGACGAT GGAAGCGGCC GAAGCACGTT TCAAGGGCGA GGAACCGGGT 
TTCGTCTATT CCCGCTACAA TAATCCGACT AATGCCATGT TCGAGGAACG CATGGCCTTG 
CTCGAGGGAG CCGAAGCGGC CCGTGCGACT GCGAGCGGCA TGGCGGCGGT AACGGCCGCT 
TTGCTCGCGC CCTTGAAGGC CGGTGATCAT GTCGTCGCTT CGCGTGCCTT GTTCGGCTCC 
TGCCTCTATA TTGTCGAGGA ATTGCTGCCG CGCTACGGTA TTGCCTCCAC GCTGGTCGAT 
GGCAAGGATT TCAAGGCCTG GAAAGACGCG CTGCGGCCGC AGACCCAGAC CTTGTTTCTG 
GAAAGCCCAA CCAATCCAAG CCTCGAGGTC TATGATATTG CGGCTGTCGC GGCGATTGCC 
CATGCTCATG GCGCGCGCCT CGTCGTCGAT AATGCCTTCG CTTCGCCCAT GTTGCAGAAG 
CCGCTGCAAC TCGGCGCTGA TTGCGTGGTC TATTCGGCGA CCAAACATAT CGATGGGCAG 
GGGCGTTGCC TTGGTGGTGT CGTCCTTTCG AGCAAGGATT TCATCGAAAC GCATCTCCAG 
ACCTATTTGC GCCAGACGGG TCCCGCTCTG TCTCCCTTCA ACGCATGGAT TCTTTTGAAG 
TCCCTGGAAA CCCTGCCGCT GCGTGTCCAG CAGCAGATGG CCAATGCGGC AAAAGTCGCC 
GATTTCCTGG CGGATCATCC GCTGATCGCG CGCTGTTTCT ATCCTGGCCG CGCCGATCAC 
CCGCAAGCCG AGATCGTCAA ACGGCAAATG CTCGGGGGAG GCACGATGGT CGCCTTCGAG 
GTCACGGGCG GCAAGCCGGC CGCCTTCGCC TTCGCCAATG CTCTGTCGAT CATCAAGATT 
TCGAATAATC TCGGTGACGC CAAAAGCCTC ATCACGCATC CGGCCACGAC GACGCATCAG 
CGTCTCACAC CGGAGGCGCG TGCCACCATG GGCATCGGCG AGGGACTGCT CAGACTGTCG 
GTGGGGCTCG AGGACGCGGA AGATCTGATC GCCGATTTGC AAGCCGCGCT CGCGGTGCTT 
GGACAAAAGC AGCTTGCCGC TGAATAA

Protein sequence

MQDFKPPRDP EGWRTATRLV HGGTTRSPFG ETAEAIFLTQ GYVYPTMEAA EARFKGEEPG 
FVYSRYNNPT NAMFEERMAL LEGAEAARAT ASGMAAVTAA LLAPLKAGDH VVASRALFGS 
CLYIVEELLP RYGIASTLVD GKDFKAWKDA LRPQTQTLFL ESPTNPSLEV YDIAAVAAIA 
HAHGARLVVD NAFASPMLQK PLQLGADCVV YSATKHIDGQ GRCLGGVVLS SKDFIETHLQ 
TYLRQTGPAL SPFNAWILLK SLETLPLRVQ QQMANAAKVA DFLADHPLIA RCFYPGRADH 
PQAEIVKRQM LGGGTMVAFE VTGGKPAAFA FANALSIIKI SNNLGDAKSL ITHPATTTHQ 
RLTPEARATM GIGEGLLRLS VGLEDAEDLI ADLQAALAVL GQKQLAAE