Gene Csal_2149 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_2149
Symbol
ID	4026489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	2420732
End bp	2421898
Gene Length	1167 bp
Protein Length	388 aa
Translation table	11
GC content	65%
IMG OID	637967354
Product	hypothetical protein
Protein accession	YP_574199
Protein GI	92114271
COG category	[S] Function unknown
COG ID	[COG1289] Predicted membrane protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.432183
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGATGTCGC TTTCACGCCT CCGCGATCCG TATTTCATCT ATCGCTATCG CCATCGTCTG 
CACGTGTTGC GCACATCGCT GGCGCTGGCC ATCACCTATG TCATCATCCT GACCCTCGAG 
ATTCCCCACG GCAGCTGGGC GCTGGTCAGC ACGATGATGG TGATGGGCAA CCTGCCGCAT 
ATCGGCGGCG TCATCGACAA GGGGGGACAG CGCCTGCTGG GCACGGTACT CGGCGCGATC 
TGGGGCGTGT TGCTGGTGCT GATCCCGGCA CCGGCACCCT GGGTGATTCC CGCCTGGACG 
CTGATCGGCA TCGCCGTGGC CACGCACACC ACCTTTGCCA CGCGCTATGG CTACAGTGCG 
CTGATGTTCG GCGTGACGCT CCTGATGGTC GTCGGCGATG GGCATCAGGA TCTGGGCATC 
GCGCTGTGGC GCGCCTTCGA CGTCCTGATC GGCACGCTCG TCGGCATTCT CGCCACGCTC 
TTCATCCTGC CGCAGAAAGC CACCGACTTG CTGCGCTTTT TGCTGGCGGA CAACCTCGAC 
AAGCTGGCGC GCCTTTATCA TGCCCATACG AGCGCCGCCC AGCAGGAAGA CGTCGATACG 
CGCCAGTTGC TCAAGACCAC CTCCACGCAA CTGGTCAAGC AACGTGGCCT GGTGGACGCC 
ATCCACAGCG AGCGCCGCCT GCACCGCGAC GACCTGGAAC GCATCCTGTC GCTGGAAAGA 
CGCATGCTGT CGACCATCGA GCTGTTGCTG GAGACGCACT GGGCGACCCG AGCCGGCCAC 
GACATCATCG CCGGTCTGGA AGGCTTGCGT GACGAGCAGC ACCGCCTGGC CCGCGCCCTG 
GGCAGCCTGG CCTTTCAAGT GCGCACCGGG CAGAGCATCG ACCTCACGGT GGTCGCCTTC 
GACCTGCAGC GTCACGCGCA AGCGACCTTG AGCGTGCATG CCGACGACGG TCGCGCACTC 
TTCAGCCCAA GCGGCTATCT ATGGCTCAAC CGCGAGCTGG CACGCCTCAC CCAGGCGCTG 
ATCGACACGC TGCAGACCAT CAACCGCTTG CCCAGTGCCC GCTTGCGTCG ACGCGCCTCG 
CGCCAGGCCT TGATCCGCGA CCGCCTGGCC ATGCCGCTGG ATCCGTCCCA GGGGCGGCGC 
GACGGCGACA AGGACAAGCC CAACTGA

Protein sequence

MMSLSRLRDP YFIYRYRHRL HVLRTSLALA ITYVIILTLE IPHGSWALVS TMMVMGNLPH 
IGGVIDKGGQ RLLGTVLGAI WGVLLVLIPA PAPWVIPAWT LIGIAVATHT TFATRYGYSA 
LMFGVTLLMV VGDGHQDLGI ALWRAFDVLI GTLVGILATL FILPQKATDL LRFLLADNLD 
KLARLYHAHT SAAQQEDVDT RQLLKTTSTQ LVKQRGLVDA IHSERRLHRD DLERILSLER 
RMLSTIELLL ETHWATRAGH DIIAGLEGLR DEQHRLARAL GSLAFQVRTG QSIDLTVVAF 
DLQRHAQATL SVHADDGRAL FSPSGYLWLN RELARLTQAL IDTLQTINRL PSARLRRRAS 
RQALIRDRLA MPLDPSQGRR DGDKDKPN