Gene Hhal_1402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1402
Symbol
ID	4711146
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1514973
End bp	1516241
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	65%
IMG OID	639855869
Product	isocitrate lyase
Protein accession	YP_001002971
Protein GI	121998184
COG category	[C] Energy production and conversion
COG ID	[COG2224] Isocitrate lyase
TIGRFAM ID	[TIGR01346] isocitrate lyase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGAAAG ATCAAGCGGC GATTGAGCGT GACTGGGCGG AGAACCCGCG CTGGAAAGGG 
GTGCAGCGGG GCTACGGGGC CGATGAGGTC GTCCGTCTCC GGGGGACCGT GCACGTCGAG 
TACAGCCTGG CGCGCCAGGG TGCAGAGAAG CTGTGGCAGT CCATGCACGA GATGCCCTAC 
GTCAACGCCC TCGGCGCCCT GACCGGCAAC CAGGCCCTGC AGCAGGTCAA GGCCGGGCTC 
AACGCCATCT ACCTCTCGGG CTGGCAGGTG GCCGCCGACG CCAACCTCGG TCAGACCATG 
TATCCCGACC AGTCGCTCTA CCCGGCGAAC TCAGTCCCTG CGGTGGTCGA TCGCATCAAC 
AACGCGCTGC TGCGCGCCGA CGAGATCAAC CACGCCGAGG GCAACCCGCC GTTCGACTTC 
ATGAAGCCCA TCGTGGCGGA CGCCGAGGCC GGTTTCGGCG GCGTGCTGAA CGCCTTTGAG 
CTGATGAAGG GGATGATCCG CGCCGGTGCC GCGGGGGTCC ACTTCGAGGA TCAGCTGGCT 
TCGGTGAAGA AGTGCGGCCA CATGGGCGGC AAGGTGCTGC TGCCCACCCA GGAGGCGGTG 
CAGAAGCTCA TCGCTGCGCG CCTGGCGGCC GACACCATGG ATGTGCCGAC CATCCTGGTC 
GCCCGTACGG ACGCCGAGGC GGCAGACCTG CTGACCTCCG ACGTGGACGA CAACGACAAG 
CCGTTCATTA CCGGCGAGCG CACTGCGGAG GGCTTTTTCC GCACCAAGCC GGGCATCGAG 
CAGGCCATCA GCCGCGGCCT CGCCTACGCC CCTTACGCCG ACGTGATCTG GTGCGAGACC 
GGCAAGCCGG ATCTCGAATT CGCCCGCGAA TTCGCGCAGG CCATTCACGA GAAGTATCCC 
GGCAAGCTGC TCGCCTACAA CTGCTCGCCG TCGTTCAATT GGGCGGGCAA CCTGGACGAG 
GCCACCATCC GCAAGTTCCA GGATGAGCTC GGTAAGATGG GCTTCAAGTT CCAGTTCATC 
ACGCTGGCCG GCTTCCACTC GCTCAACTAC TCGATGTTCG AGCTGGCCCG CGGCTACAAG 
GAGCGGCAGA TGGAGGCGTA CTCCGAGCTG CAGCAGGCGG AGTTTGCCGC GGAGAAACAC 
GGTTACACCG CGACCCGTCA CCAGCGGGAG GTGGGCGCCG GCTACTTCGA CCAGGTCACC 
AACGTGATCC AGGGCGGCCA GTCCTCGGTG ACAGCGCTGA AGGGGTCGAC GGAGGAAGAG 
CAGTTCTAA

Protein sequence

MLKDQAAIER DWAENPRWKG VQRGYGADEV VRLRGTVHVE YSLARQGAEK LWQSMHEMPY 
VNALGALTGN QALQQVKAGL NAIYLSGWQV AADANLGQTM YPDQSLYPAN SVPAVVDRIN 
NALLRADEIN HAEGNPPFDF MKPIVADAEA GFGGVLNAFE LMKGMIRAGA AGVHFEDQLA 
SVKKCGHMGG KVLLPTQEAV QKLIAARLAA DTMDVPTILV ARTDAEAADL LTSDVDDNDK 
PFITGERTAE GFFRTKPGIE QAISRGLAYA PYADVIWCET GKPDLEFARE FAQAIHEKYP 
GKLLAYNCSP SFNWAGNLDE ATIRKFQDEL GKMGFKFQFI TLAGFHSLNY SMFELARGYK 
ERQMEAYSEL QQAEFAAEKH GYTATRHQRE VGAGYFDQVT NVIQGGQSSV TALKGSTEEE 
QF