Gene Hhal_1980 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1980
Symbol
ID	4710335
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	2181640
End bp	2182668
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	71%
IMG OID	639856453
Product	lysine 2,3-aminomutase YodO family protein
Protein accession	YP_001003546
Protein GI	121998759
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1509] Lysine 2,3-aminomutase
TIGRFAM ID	[TIGR00238] KamA family protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.44193
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCTAACCG ATACGGCCCG ACAGCCCAAG CCAGGCAGAG AGCGCCGCGC CGCCGAGCGC 
TGGCGGCAGG AGCTGATCGG TGCGATTCGG CAGCCCGAGG AGCTGCTCCG GCGCCTGGAT 
CTGCCTGAGT CACTGCTGGC CCCGGCCGAA CAGGCCGCCC GGACCTTCCC AATGCGAGTG 
CCGGTCCCCT ACCTGGCGCG CATCCGTCCC GGAGACCCCA ACGACCCGCT GCTGCGCCAG 
GTGCTGCCCA TCGGCGCCGA ACTCGAGACC CATCCCGGCT ACACCGCCGA CCCCCTGGCC 
GAGCAGGGTG CCCGCACCGG CAGCGGCGTG CTGCAGAAGT ACAACGGCCG GAGCCTGCTC 
ATCGCCACCG GCGGCTGCGC CATCCACTGC CGTTACTGTT TCCGGCGCTG CTTCCCGTAC 
AACCGCGAGG CGGGCTGGCG CACCGCCCTG GATCAGCTCG AGCAACACGG AGCCCCCGAG 
GAGGTCATCC TCAGCGGCGG AGATCCGCTG CTCCTCGACG ATCAGGCGCT AGGCGCCTGC 
CTCGAGCGCC TCGGCCGCAT CGCCGCGGTG CGCCGGGTAC GTATCCACAC CCGGCTACCG 
GTGGTGATCC CTTCCCGGGT CACTGCGGCC CTCGCCCGCC ACCTGGGGCA AATCCGACTA 
CAGAGCGTGA TCGTGGTCCA CGCCAACCAC CCCCGGGAGA TCGACGCGGA GGTCAGCTCG 
GCCCTGGCCC GGCTGCGAAA CGTCTGCTCG ACGGTCCTCA ACCAGACGGT GCTGCTGCGC 
GGCGTCAACG ACGATACCGC CACCCTGGCG TCCCTCTCCG AGCGGCTGTT CGCCGCCGAC 
GTCCTCCCCT ACTACCTACA TCTGCTCGAC CCGGTAGCCG GGGCGGCTCA CTTCGACGTG 
GACGCAAAAA CCGGGCAGCG GCTCTGGGCG GAACTGGCCC GGAGCTTGCC CGGTTATCTG 
GTGCCGCGCC TAGCCCGCGA GGAGCCCGGC GCGGCGGCCA AGACGGTGAT TACACCGGAC 
GCCCCTTGA

Protein sequence

MLTDTARQPK PGRERRAAER WRQELIGAIR QPEELLRRLD LPESLLAPAE QAARTFPMRV 
PVPYLARIRP GDPNDPLLRQ VLPIGAELET HPGYTADPLA EQGARTGSGV LQKYNGRSLL 
IATGGCAIHC RYCFRRCFPY NREAGWRTAL DQLEQHGAPE EVILSGGDPL LLDDQALGAC 
LERLGRIAAV RRVRIHTRLP VVIPSRVTAA LARHLGQIRL QSVIVVHANH PREIDAEVSS 
ALARLRNVCS TVLNQTVLLR GVNDDTATLA SLSERLFAAD VLPYYLHLLD PVAGAAHFDV 
DAKTGQRLWA ELARSLPGYL VPRLAREEPG AAAKTVITPD AP