Gene Csal_1167 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1167
Symbol
ID	4028106
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	1333425
End bp	1334537
Gene Length	1113 bp
Protein Length	370 aa
Translation table	11
GC content	68%
IMG OID	637966344
Product	biotin synthase
Protein accession	YP_573222
Protein GI	92113294
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.893176
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACCGCCC AGTCCCGCGA CCCTGCCTGG ACCGATGCGT CGCCGACCTT CCAGCCGACG 
ATGCGCCACG ACTGGTCCCT GGAGGAGATC GAAGCGCTGT TCGCGCTGCC CTTCAACGAC 
TTGCTGTTCC GTGCCCAGCA GGTCCACCGC GCGCACTTCG ATCCCAACGC CGTGCAGGTC 
TCGACCCTGC TGTCGATCAA GACCGGCGCC TGCCCCGAGG ACTGCAAGTA CTGCCCGCAA 
TCCGGGCACT ACAACACCGG TCTCGGCAAG GAGAAGCTGC TCGAGATCGA GAAGGTGGTG 
GAGCAGGCCC GTGCCGCCAA GGCGGCCGGT GCCAGCCGCT TCTGCATGGG CGCCGCCTGG 
CGCAGCCCGC GGGAGAAGGA TCTGCGGGTG GTGACGGAGA TGGTCGGCCG GGTCAAGGCG 
CTGGGGCTGG AGACCTGCAT GACGCTCGGC ATGGTCGACG TCGATCAGGC CAGGCGCCTC 
GCCGAGGCCG GGCTCGACTA CTACAACCAC AACCTGGATA CCTCGCCGGA CTACTACGGC 
GAGATCATCA CCACCCGCAC CTATGCCGAC CGCCTGGAGA CGCTCGCCAA CGTGCGCGAA 
GCGGGCATGA AGGTCTGCTC CGGCGGCATC CTGGGCATGG GCGAGGCACC TCGCGATCGC 
GCCGCCCTGC TCCAGCAGCT GGTACGCCTG GATCCGCATC CCGAGTCGGT GCCGATCAAC 
ATGCTGGTCA AGGTGCCGGG CACCCCGATG GAAAACGTCG AGGACATGGA CCCGCTGACG 
TTCATTCGCG CCATCGCCGT GGCCCGCATT CTGATGCCCA AGAGCCACGT GCGCCTGTCC 
GCCGGGCGCG AGCAGATGGA CGAGTCGACC CAGGCCCTGG CCTTCCTGGC CGGCGCCAAC 
TCGATCTTCT ACGGCGACAC CCTGCTGACC ACCGGCAACC CCCAGGTGGA GCGCGACCGG 
GCACTGTTCG ACAAGCTCGG CCTGCATCCC GAACCCAGCG ACCCGCATGC GGACGACGCC 
CACCGTGACG ACGAACAGGC CGAGATCGCG CTGGCCCATG CCATTCAGCG CCAGCGTGAC 
GACGCCCTTT TCTACGACGC CACCCGGGGC TGA

Protein sequence

MTAQSRDPAW TDASPTFQPT MRHDWSLEEI EALFALPFND LLFRAQQVHR AHFDPNAVQV 
STLLSIKTGA CPEDCKYCPQ SGHYNTGLGK EKLLEIEKVV EQARAAKAAG ASRFCMGAAW 
RSPREKDLRV VTEMVGRVKA LGLETCMTLG MVDVDQARRL AEAGLDYYNH NLDTSPDYYG 
EIITTRTYAD RLETLANVRE AGMKVCSGGI LGMGEAPRDR AALLQQLVRL DPHPESVPIN 
MLVKVPGTPM ENVEDMDPLT FIRAIAVARI LMPKSHVRLS AGREQMDEST QALAFLAGAN 
SIFYGDTLLT TGNPQVERDR ALFDKLGLHP EPSDPHADDA HRDDEQAEIA LAHAIQRQRD 
DALFYDATRG