Gene Hhal_1024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1024
Symbol
ID	4709218
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1097640
End bp	1099037
Gene Length	1398 bp
Protein Length	465 aa
Translation table	11
GC content	70%
IMG OID	639855495
Product	argininosuccinate lyase
Protein accession	YP_001002602
Protein GI	121997815
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0165] Argininosuccinate lyase
TIGRFAM ID	[TIGR00838] argininosuccinate lyase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.350248
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCAGA ATGACGCAGC CCCCGGCCAG CAGCTGTGGA CCGGCCGCTT CACCGAGGCG 
ACCGACGCCT TCGTCGAGCG CTTCTCGGCC TCCGTGCAGT TCGACGCGCG CCTCGCCCTG 
CAGGATATCC AGGGCTCCGA GGCCCACGCC CGCATGCTCG CCGCGCGTGG CGTGCTGACC 
GAGGCGGAGC GCGACGCCAT CCTCCAGGGG CTGGCCGAGA TCCGCCAAGA GGTGGTCGAG 
GAGCGCTTCC CGTGGTCGCC GCAGCTCGAG GATGTGCACA TGAACATCGA GCATCGGCTG 
ACCCAGCGCA TCGGCGAGGC CGGCAAGAAG CTGCACACCG GCCGCTCGCG CAACGATCAG 
ATCGCCACCG ACGTGCGCCT CTTCCTGCGC GAGGCCATCG ATACCATCCG TGCCGAGTTG 
GCCCGCTTCC AGCACGGGCT GGTGGAACTG GCCGAGCGCG AGGCCGACAC CATCATGCCC 
GGCTTCACCC ACCTGCAGGT GGCGCAGCCG GTGACCTTCG GGCACCACAT GCTGGCCTGG 
TACGAGATGC TCGAGCGCGA CCGCGACCGC CTGGCGGACT GCCGGCGGCG CCTGAACCAG 
TGTCCGCTCG GCGCGGCGGC GCTGGCGGGG ACGTCGTTCC CCATCGACCG CGAGGCGACC 
GCCCGGGAGC TGGGCTTCGA CGCGCCGACG CGCAACTCCC TGGACTCGGT CAGCGATCGC 
GATTTCGCCA TCGAATTCTG TGCCGACGCC AGCCTGATCC TCGTCCACCT CTCGCGCATG 
GCCGAGGAGC TGGTGCTGTG GACCTCTCAG CAGTTCGGCT TCATCGAGCT GCCGGATCGC 
TTCTGCACCG GTTCTTCGAT CATGCCGCAG AAGAAGAACC CGGACGTGGC GGAGCTGGTG 
CGGGGCAAGG CGGCCCGTGC CCAGGGCAGC CTGGTCCAGC TGCTGACCCT GATGAAAGGC 
CAGCCGTTGG CCTATAACCG GGACAACCAG GAGGACAAGG AGCCGCTTTT CGACGCCGTG 
GACACGGCGC GGGATGCGCT GACCGCCTTC GCCGACATGG TCCCGGCGCT GAGCGTCAAC 
CGCGAGCGTT GCCGCGCGGC GGCCCGGGCC GGCTTCGCCA CGGCCACCGA CCTGGCCGAC 
TACCTGGTCC GCCAGGGGCT GGCCTTCCGC GACGCCCACG AGGTGGTCGG CCGTGCCGTG 
CGTTACGCCA CCGAAGCCGA TCGGGATCTC GCCGAGCTCA GCCTTGAGGA GCTCCAGCAG 
TTCTCCACCG CCATCGGGGA CGACGTCTTC GCCGTGCTCA CCCTCGACGG CTCGGTCGCG 
GCGCGCTCCC ACGTTGGCGG CACGGCGCCG GAGCAGGTCC GTGCCCAGGC CCAGGCGGCC 
CGGGAGCGCC TGGCTTGA

Protein sequence

MSQNDAAPGQ QLWTGRFTEA TDAFVERFSA SVQFDARLAL QDIQGSEAHA RMLAARGVLT 
EAERDAILQG LAEIRQEVVE ERFPWSPQLE DVHMNIEHRL TQRIGEAGKK LHTGRSRNDQ 
IATDVRLFLR EAIDTIRAEL ARFQHGLVEL AEREADTIMP GFTHLQVAQP VTFGHHMLAW 
YEMLERDRDR LADCRRRLNQ CPLGAAALAG TSFPIDREAT ARELGFDAPT RNSLDSVSDR 
DFAIEFCADA SLILVHLSRM AEELVLWTSQ QFGFIELPDR FCTGSSIMPQ KKNPDVAELV 
RGKAARAQGS LVQLLTLMKG QPLAYNRDNQ EDKEPLFDAV DTARDALTAF ADMVPALSVN 
RERCRAAARA GFATATDLAD YLVRQGLAFR DAHEVVGRAV RYATEADRDL AELSLEELQQ 
FSTAIGDDVF AVLTLDGSVA ARSHVGGTAP EQVRAQAQAA RERLA