Gene Csal_3106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3106
Symbol
ID	4028747
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	3460608
End bp	3461837
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	63%
IMG OID	637968320
Product	HemY-like protein
Protein accession	YP_575149
Protein GI	92115221
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG3071] Uncharacterized enzyme of heme biosynthesis
TIGRFAM ID	[TIGR00540] hemY protein

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.417009
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGAAAGC TGATTCTTCT CATCGTCGTG GGGCTGGCCG TCGGTGCACT GTTCGGCCAG 
TTGATGCAGT CGATGCCCGG TTACTGGCTG GTGCGGGTGG GCGACACCTC GATCCAGACC 
TCGTTCTGGC TGGGGCTGGT GATCCTGCTG GCGGTCTTCC TGGTCTTGCA CTTCGCGCTG 
CGTCTGCTGC GCAGGCTGCG GCGCCCGGTG AGCCGCCTCA AGGTCTGGAA CAGCCGTACC 
CGCAATCGCA ATGCCATGAA GCGTACCGTG CGCGGTCTGG TCGCCTTGGC CGAGGGGCGC 
TGGAAGCGGG CCGAGAAGGA CCTCGTCAAG GCGGCTGACG ATTCCAGCAC GCCCTTGGTC 
AATTACCTGT CCGCGGCACT GGCAGCGCAT TATCAGGGGC GTTTCGATCA CGCCGATACG 
TTGCTCAAGC GGGCCCACCA CAGTACCGAG GGCGCCGATA GCGCCGTCGG CATGGTGCAG 
GCGCAGCTGA TGCTCGACCG GCAACAGTTC GAGGAGGCGC TGGCGACCCT GACGCGTCTC 
GAAAAGCAGT TGCCGAATCA TCCGCAGGTG CTCAAGTTGC TGCGTCAGGC CTATCTCAGC 
GTCAATGACT GGGAAGGACT GCGTCACCTT TTACCCAAGC TCGACAAGCA GCAGTTGATC 
ACCGAGGAGG AGCGTCAGGA ACTGGAGCAG CGTGCCTATC GAGAGCTGAT TCTCCAGGCG 
GTTCAGCGTC AGCCGAATGC CGATGTCAAT CGCGTGCGCA ACCTGTGGGC CGATATGCCC 
GACTACCTGC GCAGCGATGT CGAGCTGGTG GTGCTGTATA CCGAGGCGCT GGTCAAGGGC 
GGCGAGGAGG CGATCGCCGA ACGCCTGCTG CGCCATTCCC TCAAGGAGCA TTGGGATACG 
CGTCTGGTGC TGCGCTATGG GCTGCTCAAC GTGGATGCGG GGCGCCAGCT GGCCTATGCC 
GAGAAGTGGC TGCAAGAGCG ACCCAACGAC CCCGATTTAC TGTTGACCCT GGGGCGGCTA 
TCGTTGCGCA ACGCCTACTG GGGCAAGGCA CAGGAGTATT TCGAGGCGAG TCAGCGTCAG 
CGTCCCAGCG GGGTGGTGTG TGCCGAGCTG GCGCGCCTTT ACGCCAATCT GGGCGAGCAT 
CAGAAGAGTC AGCTCTTTTA TCGCCAGAGC GTGGAATTGC TCGATCGCTC GCTGCCGGCG 
TTGCCGCAGC CTAGCGAGCG CACGCGCTAA

Protein sequence

MRKLILLIVV GLAVGALFGQ LMQSMPGYWL VRVGDTSIQT SFWLGLVILL AVFLVLHFAL 
RLLRRLRRPV SRLKVWNSRT RNRNAMKRTV RGLVALAEGR WKRAEKDLVK AADDSSTPLV 
NYLSAALAAH YQGRFDHADT LLKRAHHSTE GADSAVGMVQ AQLMLDRQQF EEALATLTRL 
EKQLPNHPQV LKLLRQAYLS VNDWEGLRHL LPKLDKQQLI TEEERQELEQ RAYRELILQA 
VQRQPNADVN RVRNLWADMP DYLRSDVELV VLYTEALVKG GEEAIAERLL RHSLKEHWDT 
RLVLRYGLLN VDAGRQLAYA EKWLQERPND PDLLLTLGRL SLRNAYWGKA QEYFEASQRQ 
RPSGVVCAEL ARLYANLGEH QKSQLFYRQS VELLDRSLPA LPQPSERTR