Gene Csal_0344 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_0344
Symbol
ID	4026888
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	384391
End bp	385452
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	64%
IMG OID	637965493
Product	Rieske (2Fe-2S) protein
Protein accession	YP_572405
Protein GI	92112477
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTCCCCA AGAACACTTG GTACGTGGCC TGCACGCCGG ACGAGATCGA AGAAAAACCG 
CTCGGCCGCA CGATCTGCAA CGAACAAATC GTCTTTTTCC GTGCCGAGGG CGGCCAGGTC 
GCCGCCGTCG AAGACTTCTG CCCTCATCGC GGCGCGCCCT TGTCGCTGGG TTTCGTACGT 
GACGGTCAAC TGGTATGCGG CTACCACGGC CTCGAAATGG GCTGTGACGG CAAGTGCTCC 
AGCATGCCGG GCCAGCGCGT GCGCGGCTTC CCCAGCATTC ATGCGTATCC CGTCGTCGAA 
CGTCACGGCT TCATCTGGGT CTGGCCCGGC GATGCCGAGC AGGCCGACCC GGACCAGATC 
CCCGAGCTGC ACTGGGCCAA CGACCCCGAG TGGGCCTATG GCGGCGGGCT TTATCACATC 
AACTGCGATT ACCGCCTGAT GATCGACAAC CTCATGGACC TGACCCATGA GACCTACGTT 
CACGCTTCCA GCATCGGTCA GCCCGAGATC GAGGAAGCCG CGCCGGAAAC CAAGGTCAAC 
GGCGACGAGG TGCTGACCAT CCGGCACATG GAGAACATTC CCGCGCCGCC GTTCTGGCAA 
TCCGCATTGC GCGGCAACAA CCTCGCCGAC GACGTCCCCG TGGATCGCTG GCAGATCTGT 
CGCTTCACGC CGCCCAGCCA CATCCTGATC GAAGTGGGCG TCGCGCACGC CGGCAAGGGA 
GGCTACGACG CGCCGGCCGA TGCCAAGGCG TCGAGCATCG TGGTGGATTT CATCACGCCG 
GAAACCGAGA CCTCGATCTG GTACTTCTGG GGCATGGCCC GCAACTTCAA TCCGCAGGAC 
GAGGCGCTGA CCGAGCAGAT CCGCGAGGGC CAGGGCAAGA TCTTCGCCGA AGACCTGGAG 
ATGCTCGAAT CCCAGCAGCG CAACCTGCTC CGCTATCCCG ACCGCCGTCT GCTGATGCTC 
AACATCGACG GCGGGGGCGT CCAGGCGCGA CGGGTCATCG ACCGCATCCT CAAGGCGGAA 
GCCGAAAACG CGCAGCCGCA GCAGGCCGCC ACCGCCAGTT GA

Protein sequence

MFPKNTWYVA CTPDEIEEKP LGRTICNEQI VFFRAEGGQV AAVEDFCPHR GAPLSLGFVR 
DGQLVCGYHG LEMGCDGKCS SMPGQRVRGF PSIHAYPVVE RHGFIWVWPG DAEQADPDQI 
PELHWANDPE WAYGGGLYHI NCDYRLMIDN LMDLTHETYV HASSIGQPEI EEAAPETKVN 
GDEVLTIRHM ENIPAPPFWQ SALRGNNLAD DVPVDRWQIC RFTPPSHILI EVGVAHAGKG 
GYDAPADAKA SSIVVDFITP ETETSIWYFW GMARNFNPQD EALTEQIREG QGKIFAEDLE 
MLESQQRNLL RYPDRRLLML NIDGGGVQAR RVIDRILKAE AENAQPQQAA TAS