Gene Csal_1670 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_1670
Symbol
ID	4028682
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	+
Start bp	1899909
End bp	1901057
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	69%
IMG OID	637966859
Product	benzoate membrane transport protein
Protein accession	YP_573722
Protein GI	92113794
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0659] Sulfate permease and related transporters (MFS superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTACCG TTCCTGTTTC CCCACGCGGG GCCGCCTTTG TCTTCAATGG CCGCGAGCTC 
AATGGCGCCC TGGGCGATCT CGGCACCCTG CTGCCGCTGC TGCTGGGCGT GCTGGCGGTG 
GGCGGCGTGT CGCCGGGGCC GGTGCTGTTC GGTTTCGCGG CGTTCTATCT CGTCACCGCG 
TTCTACTATC GCCTGCCGAT TCCCGTACAG CCCATGAAGG CCGTCGCCGC GATGCTGCTC 
ACCGTGGGCA TGTCGGCCTC CGAACTGGCC ATCGGCGGTA TGATCATCGG CCTGGTGATG 
CTGGTGCTCG GGCTCACGGG ATGGATAGGC CACCTGCGCC GTTTGATTCC GCAATCCGTG 
CTGGCCGGGC TGCAACTGGG GCTGGGCGTG ATGCTGGCGC TGGCCAGTCT CTCGCTGATG 
GCCGAGCAAG CCTGGCTGGC GGGGGTGACC CTGGCGGTGC TGCTGGTGGC GATGCGCATA 
CCGGGGTGCC CCTCGGTACT GCTCGCCTTG CTGGTCGCGG TGGGGTTGGG CATTCCGCAA 
TGGGGGCAAG GGCCGGATCT CGTCGCGGCC GGGCAGGGCA TGTTCCCACT CACGGGCTGG 
CCCGGCGTCG AGTCCTTCGA GCGTGCCATG TCGATGCTGG TGCTGCCGCA ACTCTCGCTG 
ACCGTCACCA ACGCCATCGT GCTCACCGCG CTCGTCGCCG GCGACTACTT CGGCGAGCGC 
GCGGCGCATG TCACCCCCGC GCGGCTGTCG ATCACCACCG GCCTGGCCAA TCTCCTGCTC 
AGCCCCCTGG GGGCCTTGCC CATGTGCCAC GGTGCGGGCG GGCTGGCGGC GCATTACCGC 
TTCGGCGCGC GCAGCGGCAC GGCGCCGTTG TTGCTGGGGT TGGGACTGCT GGGCGTGGCG 
TGTCTGCCAA CATCGTGGGG CCTGGCCATG CTCGCCGCGA TTCCCGTCGC CGGGCTGGGC 
GCCTTGCTGC TCGTTGCCGC CTGGCAACTG GCCGTCACCA AGCGACTTTA CGATAGCAAG 
CCCTCGTGCT GGCCGGTGAT CGCCGCGACC GCCGTGGCGA CGGTCGCGCT GGATCCTTTC 
TGGGGGCTGG TGGCCGGGGG CGTCAGCGAA TGGGCAAGAG TCAGCTGGCG TCGGCGTCGC 
CACGCTTGA

Protein sequence

MPTVPVSPRG AAFVFNGREL NGALGDLGTL LPLLLGVLAV GGVSPGPVLF GFAAFYLVTA 
FYYRLPIPVQ PMKAVAAMLL TVGMSASELA IGGMIIGLVM LVLGLTGWIG HLRRLIPQSV 
LAGLQLGLGV MLALASLSLM AEQAWLAGVT LAVLLVAMRI PGCPSVLLAL LVAVGLGIPQ 
WGQGPDLVAA GQGMFPLTGW PGVESFERAM SMLVLPQLSL TVTNAIVLTA LVAGDYFGER 
AAHVTPARLS ITTGLANLLL SPLGALPMCH GAGGLAAHYR FGARSGTAPL LLGLGLLGVA 
CLPTSWGLAM LAAIPVAGLG ALLLVAAWQL AVTKRLYDSK PSCWPVIAAT AVATVALDPF 
WGLVAGGVSE WARVSWRRRR HA