Gene Hhal_1797 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1797
Symbol
ID	4711000
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1968924
End bp	1970117
Gene Length	1194 bp
Protein Length	397 aa
Translation table	11
GC content	69%
IMG OID	639856267
Product	O-succinylhomoserine sulfhydrylase
Protein accession	YP_001003363
Protein GI	121998576
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID	[TIGR01325] O-succinylhomoserine sulfhydrylase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.697099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTGCACAA CCAGGCCTGA TGACGATCCG CTCGCCGGGT TCGAATCCCG GGCGGTGCGA 
GCCGGTCAGG TGCGCACCGA TGCCCAGGAG CAGTCGGAGC CCATCTACCC GACCTCCAGC 
TTTACCTTCG AGAGTGCCGC ACAGGCGGCC GCGCGTTTCT CCGGTGAGGA CCCCGGGAAC 
GTCTACTCGC GTTTCACCAA CCCGACGGTG CGGACCTTCT GCGACCGCCT GGCCGCCCTG 
GAGGGCGGGC AGGCCTGCGT CGGGACGGCT TCAGGCATGT CGGCGGTGCT GGCGACGTGC 
CTGGGGCTGC TGCAGGCCGG CGACCACGTG GTCGCCTCGC GGACCCTCTT CGGGACCACC 
CTGTCGCTGC TGACCAAGTA CCTGCCGCGC TGGGGCATCG AGGTCAGCTG GGTGCCGTTG 
AGCGACGAGC GGGCCTGGGC TGATGCGGTG CAGCCGAACA CGCGCCTGCT CTTTGCTGAG 
ACGCCCTCCA ACCCCCTCAA CGAGGTGGTG GACATCCGCC GCCTCGCGGA GGTGGCCCAT 
GCCCACGAAG CCCTGTTGGC GATCGACAAC TGCTTCTGTA CCCCCGCCCT GCAGCGCCCG 
CTGGAGATGG GGGCCGACCT GGTGATCCAC TCGGCCACCA AGTACCTGGA CGGTCAAGGT 
CGCTGTGTCG GTGGCGCGGT GGTTGGCGAC GCCCAGCGCG TGGGGGAAGA GATCCACGGT 
TTCATCCGCA CCGCCGGGCC GTGCATGAGC CCGTTCAACG CCTGGGTGTT CCTCAAGGGA 
TTGGAGACGC TGTCCCTGCG CATGCATGCG CACAGCCGGA ATGCCCAGCA GGTGGCGGAG 
TGGCTGCAGG GCCATCCCGG CGTCGAGCGG GTCCACTACG CCGGGCTGCC GGACCATCCC 
CACCACCGCC TGGCCGCGGC GCAGCAGAGC GGGTTCGGCG GGATTGTGGC CTTCGAGCTC 
CCCGGAGGCC GGGAGGCAGC CTGGCGTCTG ATCGACAGCA CGCGCATGCT GTCGATCACC 
GGCAACCTGG GGGACACCAA GTCCACCATC ACCCATCCGG CGACCACCAC CCACGGCACC 
ATCTCCGATG AGTTGCGCGC GGCCGCCGGC ATCCGCGAGG GGCTGGTGCG GGTTTCCGTT 
GGGTTGGAGG ATCCGGCGGA TATCATCCGC GACCTGGAGC GCGGCCTGGG GTGA

Protein sequence

MCTTRPDDDP LAGFESRAVR AGQVRTDAQE QSEPIYPTSS FTFESAAQAA ARFSGEDPGN 
VYSRFTNPTV RTFCDRLAAL EGGQACVGTA SGMSAVLATC LGLLQAGDHV VASRTLFGTT 
LSLLTKYLPR WGIEVSWVPL SDERAWADAV QPNTRLLFAE TPSNPLNEVV DIRRLAEVAH 
AHEALLAIDN CFCTPALQRP LEMGADLVIH SATKYLDGQG RCVGGAVVGD AQRVGEEIHG 
FIRTAGPCMS PFNAWVFLKG LETLSLRMHA HSRNAQQVAE WLQGHPGVER VHYAGLPDHP 
HHRLAAAQQS GFGGIVAFEL PGGREAAWRL IDSTRMLSIT GNLGDTKSTI THPATTTHGT 
ISDELRAAAG IREGLVRVSV GLEDPADIIR DLERGLG