Gene Gdia_1236 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1236
Symbol
ID	6974641
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	1376093
End bp	1377295
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	68%
IMG OID	643390766
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_002275634
Protein GI	209543405
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.43898
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAACG ATTCGACCGA CCGAGCCTAC CGCCCCGCGA CCCGCCTGCT GCATTCCGGC 
GTCGAGCGCA CCCCGTTCGG CGAGACGAGC GAGGCGATGT TCCTGACATC GGGCTTCGTC 
TACGACAATG CCGAACAGGC CGAGGCGACC TTCACCGGCG ACGTGACGCA TTATCAGTAC 
AGCCGGTTCG GCAACCCCAC CGTCGAGGCG CTGGAGAAGC GCCTGGCGGA CCTGGAAGGG 
GCCGAGGCCT GCATCGCGAC CTCGACGGGC ATGGGGGCGG TGTCGTCCGC GCTGCTGTCG 
CACGTCAAGG CCGGGGACCG GGTGGTGGCG TCGCGCGCGC TGTTCGGGTC GTGCCACTGG 
ATCGTCGCCA ACCTGCTGCC GCGCTACGGG GTGGAAACGG TGTTCGTGGA CGGGGGCGAC 
ATGGACGCGT GGGCGGAGGC CCTGGCGCGG CCCACGGCGG CGGTCCTGCT GGAAAGCCCG 
TCGAACCCGA TGCTGGACAT CCTGGACATC CGCGCCATTT CCGACCTGGC GCACCAGGCC 
GGAGCCCTGG TGGTGGTCGA CAACGTCTTC GCGACCCCAC TGCTGCAGAA GCCGCTGGAA 
CTGGGGGCGG ATGTCGTCGT GTATTCCTGC ACCAAGCATA TCGACGGCCA GGGGCGTGTC 
CTGGGCGGCG CGGTGCTGGG CCGCAAGGAC TGGATCACCG ATACCCTGCA GCCCTTCACC 
CGCAATACCG GCAACGCCCT GTCGCCGTTC AATGCCTGGG TGATGCTGAA GGGGCTGGAG 
ACGCTGGCCC TGCGCGTCCG GGCAATGACC GACAATGCCG CCGCCGTCGC CGATCACCTG 
GCCGGCGCCG AGGGGGTGAC GCGGGTGTTC TATCCCGGCC GGCCCGACCA TCCGCAATAC 
GCGCTGGCGC AGGCGCAGAT GAGCGGCGCC TCCACCCTGG TCGCCTTCGA GGTCGCGGGC 
GGCAAGGCGC GCGCGTTCGC CTTCATGAAC GCGTTGCGGC TGATCGCGAT TTCCAACAAT 
CTGGGTGATG CGCGATCGAT GGTGACGCAC CCGGCCACCA CCACGCACAT GAAGATCGGC 
GCCGAGGAAC GGGCGCGACT GGGCATCACC GACGGCGTGA TCCGCTTTTC GGTGGGTCTG 
GAAGACAGCG CCGATCTGAA GGATGATCTG GATCGCGGGC TGGCCGCCCT TCGGTCACGC 
TGA

Protein sequence

MSNDSTDRAY RPATRLLHSG VERTPFGETS EAMFLTSGFV YDNAEQAEAT FTGDVTHYQY 
SRFGNPTVEA LEKRLADLEG AEACIATSTG MGAVSSALLS HVKAGDRVVA SRALFGSCHW 
IVANLLPRYG VETVFVDGGD MDAWAEALAR PTAAVLLESP SNPMLDILDI RAISDLAHQA 
GALVVVDNVF ATPLLQKPLE LGADVVVYSC TKHIDGQGRV LGGAVLGRKD WITDTLQPFT 
RNTGNALSPF NAWVMLKGLE TLALRVRAMT DNAAAVADHL AGAEGVTRVF YPGRPDHPQY 
ALAQAQMSGA STLVAFEVAG GKARAFAFMN ALRLIAISNN LGDARSMVTH PATTTHMKIG 
AEERARLGIT DGVIRFSVGL EDSADLKDDL DRGLAALRSR