Gene Csal_1004 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1004
Symbol
ID	4026227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1131260
End bp	1132597
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	63%
IMG OID	637966181
Product	Rieske (2Fe-2S) protein
Protein accession	YP_573060
Protein GI	92113132
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCATTGG CGCCATCCGT TATCGAACCG GCGCACGAAG AGGATGCCTT CATGGATCTG 
CTCGCCACAT CCGCATTAGA CGATCCCCTG GCCGCCGCGC GTGACGCGAC CGCCGACATG 
CTGCGCCAGC GGCAAGGCGA CCATTCCTTG CCGCAGCCGT TCTACAACGA TCCACGAGTG 
TTCGCGCTGG AAATGCGCGA GATCTTCGAG CACGAATGGC TGTTCGTCGG CATGACCTGC 
GAAATTCCCG CCAAGGGCAA TTACCTGACC GTGCAGATCG GCGACAATCC CATCATCGTG 
GTGCGCGGCG ATCAGGGCAC GATCCATGCC TTCCACAACG TGTGCCGACA TCGGGGATCC 
CGACTTTGCA CCCAGGCGAA GGGCAAGGTC GCCAAGCTGG TATGCCCCTA CCATCAGTGG 
ACCTACGAAC TCGACGGCCG ACTGCTGTTC GCGGGACAGG ACATGGGCGA GGATTTCGAC 
CTCGGTGCCC ACGGCCTCAA GCCGGTGGCA GTGACGCACG CCGGTGGCTT CCTCTTCGTC 
AGCCTGGCCG ATCAGCCGCC GGCCATCGAC GATTTCCTGG CCACGCTCGA TGACTATCTC 
GCGCCTTACG AGATGGATAA CGTCAAGGTG GCGGCGGAGT CGAACATCGT CGAGCAGGCC 
AACTGGAAGC TGGTCATCGA GAACAACCGC GAGTGCTATC ACTGCAACGG TGCGCATCCG 
GAGCTGCTCA ATTCGCTGAT CGAATACGAT GACACCGACG ACCCTCGCGC CACGCCCGCC 
TACCGCGACC TGGTCGCCCG CCAGCAGGCG CACTGGGAAC AGCAGCAGGT CCCCTGGGCG 
CTCAAGCGCT TCGGCAAGCG CAACCGCTTG ACCCGCACGC CGATGATCGA GGGCGTCGTC 
TCGATGACGA TGGACGGGCG CCCGGCCAGC CAGCGGTTGA TGGGACGTCT GCCGAACCCC 
GACATGGGGT CGTTGCGCAT TCTGCACCTG CCCAATTCAT GGAACCATTT CATGGGCGAT 
CATGCCGTGG TCTTCCGCGT ACTGCCGCTG GGCCCGCAGC AAACACTGGT GACCACCAAG 
TGGCTGGTCC ATCGCGACGC CCAGGAAGGC GTCGACTACG ACCCGGAATG GATGCGCAAG 
GTGTGGGACG CCACCACCGA CCAGGACCGT CAACTGGCCG AGGAAAACCA GCGCGGCATC 
AACTCCGTCG CCTACCAGCC GGGGCCCTAC TCCAGGACCT ACGAATTCGG CGTGATCGAC 
TTCGTCGACT GGTACAGCGA CACGATGCTG TCGCGACTGG ACGCAGAAGC CCCTTCATTG 
CACATCGTTC AGGGCTGA

Protein sequence

MSLAPSVIEP AHEEDAFMDL LATSALDDPL AAARDATADM LRQRQGDHSL PQPFYNDPRV 
FALEMREIFE HEWLFVGMTC EIPAKGNYLT VQIGDNPIIV VRGDQGTIHA FHNVCRHRGS 
RLCTQAKGKV AKLVCPYHQW TYELDGRLLF AGQDMGEDFD LGAHGLKPVA VTHAGGFLFV 
SLADQPPAID DFLATLDDYL APYEMDNVKV AAESNIVEQA NWKLVIENNR ECYHCNGAHP 
ELLNSLIEYD DTDDPRATPA YRDLVARQQA HWEQQQVPWA LKRFGKRNRL TRTPMIEGVV 
SMTMDGRPAS QRLMGRLPNP DMGSLRILHL PNSWNHFMGD HAVVFRVLPL GPQQTLVTTK 
WLVHRDAQEG VDYDPEWMRK VWDATTDQDR QLAEENQRGI NSVAYQPGPY SRTYEFGVID 
FVDWYSDTML SRLDAEAPSL HIVQG