Gene Hhal_1028 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1028
Symbol
ID	4709681
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	+
Start bp	1102640
End bp	1103965
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	71%
IMG OID	639855499
Product	HemY domain-containing protein
Protein accession	YP_001002606
Protein GI	121997819
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG3071] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID	[TIGR00540] hemY protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.791332
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCGCC TGTTCATCTA CCTACTGATC CTGGCCGGTG CCGTACTTAC GGCGCTGTAC 
TTCAACCAGC AGGAGGGCTA CGTGATGCTC TCCATCGGAC CGTGGCGGCT GGAGATGAGC 
CTGCTCTTCT CCGCTGTGGT CCTGGGGCTT CTGGTCCTCC TGCTCTACCT GGCCCTGGCC 
GCCCTGGGGC GGTTGTGGAG CATGCCGCGC CGGCTGCGCA GCTGGCAGGG CCAGCGCCGA 
CAGGAGTCGG CCCGCACCGA GCTGACCTCG GGGCTGCTGC GCTTTGCCGA GGGCGACTAC 
GACACCGCCG AGCAGCAGCT GGTGCATAGC GCCCGACGCA GCGAGGCACC GCTGGTCAAC 
TACCTGACCG CCGCGATCGC CGCCCAGCGT CGCGGCGCCC GGGAGGTGCG GGACGGCTAC 
CTGACCACGG CCGAGAAGAG CGGCCCCGAC GCCAACCTGG CGGTGCGGCT GCTCCAGGCG 
CAGCTGCAGG CCGAATCCGG TCAGTGGGAG GAGGCCCAGG CCAGCGTCTC GGCCGTTCTC 
GACAAGGAAC CCAAGCACCG CCGGGCCCTG GAGCTGATGG TTGGTTGCTG CCGGGCCCTG 
GGCGACTGGG AGCGACTGGA GCCCCTGCTG CCACGCATCG AGCGCCAGGG GATCCTGCCC 
AAGAACGAGC TCACCGAGCT CAACCGCTGG GTCGCCCGCG AGCGACTGGC CCAGGCCGCG 
GGCGAGGACA CCCAAGCCCT GCAGGAGGCC TGGCGTGAGT TGAGCCGGGG CCTGCGCAAG 
GATCCCGACG TCATCTGCTC CTACGTGGAC GGGCTGACCA CCCTGGGTGA GGTACAAAGC 
GCCGTGGAAC TCATCCAGAA GCAGCTGCAC AAGGAGTGGA ACCCCGACCT GCTCCAGCGC 
TACGCGCGCC TGCCGGCGGA TGACATCGAC ACCTACGCCG CCCGGCTGGA GAAGGCCGAG 
GGCTGGATCG AGGCCCACCG GGACGACCCC AAGGCCCTCT ACGCCGCCGG TGTCCTGGCC 
CTGCAGGCCG AGCAGTGGGA ACGGGGCCGG GACTACCTGC AGGCCGCCGT GGACCAGACC 
GCCCGGCCGG AGTACCTGCG GACCCTCGGC GCCCTCCAGG AGCACCTGGG GGACTACGAC 
GGCGCCCGGG CCACGTACCG GCTGGCCATG GACCTCTCCG GTGCCGGGAG CGACGCCCTC 
CCCGGTCTGC CGGGCCCGAC CGCTTCGGGT CGGACGGCCA CACCGGGGCT CGAGGACGAC 
AGTAGCGCAC CCCCCACCGA CTACGCCGCC GACGAGGACA CCGAGGGTCG GCCCCGCCAG 
GACTGA

Protein sequence

MRRLFIYLLI LAGAVLTALY FNQQEGYVML SIGPWRLEMS LLFSAVVLGL LVLLLYLALA 
ALGRLWSMPR RLRSWQGQRR QESARTELTS GLLRFAEGDY DTAEQQLVHS ARRSEAPLVN 
YLTAAIAAQR RGAREVRDGY LTTAEKSGPD ANLAVRLLQA QLQAESGQWE EAQASVSAVL 
DKEPKHRRAL ELMVGCCRAL GDWERLEPLL PRIERQGILP KNELTELNRW VARERLAQAA 
GEDTQALQEA WRELSRGLRK DPDVICSYVD GLTTLGEVQS AVELIQKQLH KEWNPDLLQR 
YARLPADDID TYAARLEKAE GWIEAHRDDP KALYAAGVLA LQAEQWERGR DYLQAAVDQT 
ARPEYLRTLG ALQEHLGDYD GARATYRLAM DLSGAGSDAL PGLPGPTASG RTATPGLEDD 
SSAPPTDYAA DEDTEGRPRQ D