Gene Csal_3226 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Csal_3226
Symbol
ID	4028560
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chromohalobacter salexigens DSM 3043
Kingdom	Bacteria
Replicon accession	NC_007963
Strand	-
Start bp	3595518
End bp	3596723
Gene Length	1206 bp
Protein Length	401 aa
Translation table	11
GC content	68%
IMG OID	637968441
Product	putative ABC transporter solute-binding protein
Protein accession	YP_575269
Protein GI	92115341
COG category	[R] General function prediction only
COG ID	[COG4134] ABC-type uncharacterized transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0901142
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACGTATT CGCGAGGCTT GCTGGTAGCG GCGTTGTCGC TGTTGCCGAC CATGGGGCAG 
GCATACGAGT TGTCCGACTG GGAATCGGTG ACCGAGGCGG CCCGGGGGCA GACCGTCTAC 
TGGAATGCCT GGGGCGGCGA TCCGCGTACC AACGCCTATA TCGACTGGGT GGCCGAGCAG 
GTCGACAAGC GCTACGCAAT CGACCTCGAG CACGTCAAGG TGGGCGATAC CGGCGAGGCG 
GTGACCCGTG TGCTGGCCGA GAAGGCGGCG GGTAACGACG AGCAGGGTGC GGTCGACCTG 
ATCTGGCTCA ATGGCGAGAA TTTCGCCGCC ATGAAGGACA ACGACCTGCT CTATGGCCCC 
TGGGCCGAGC AGCTGCCCCA CTTCCCGCTG ACCGCGCCCG AGCAGAACCC CGAGGTGCGC 
GAGGACTTCA CCCTGCCGGT CGAGGGCTAC GAAGCGCCCT GGGGACGTGC GCAGATCACC 
TTCTATTACG ACAGCGCGCG TGTCGACGCG CCGCCGCGCA GCATTCCCGC ACTGCTCGAC 
TGGGCCCGGG CGCATCCGGG GCGCTTCACC TATCCCCAGC CGCCGGCCTT TCTGGGCACG 
ACCTTCCTCA AGCAGGCACT GCTGGCCTTG ACCGAGCACC GCGAGGCGCT TTATGCACCG 
GTCGACGAGG CCGATTTCGA GTCCGTCACC GCGCCGCTGT GGGCCTACCT GGACCGCTTG 
CATCCCACTC TGTGGCGCGA GGGCGAGAGC TTCCCCGCGG GCGGGCCTCA GATGCGCCAG 
CTGATGGGCG ACGGAGCGTT GAGCCTGGCG TTCACCTTTA CCCCCTCCGC CCCGGCCGCC 
GCGGTCCTCG ATTATCAACT GCCACCGACC ACGCGCAGCT ACATCCTCGA CGATGGCACG 
CTGGGCAACG TGCATTTCGT CGCCATTCCC TTCAATGCCC AGCACAAGGC CGGCGCCTTG 
ACGGTCGCCA ACTTCCTGCT CTCGCCCGAG GCCCAGGCCC GCAAGCAGGA TCTCTCGTTG 
TGGGGCGATG CCACGGTGCT GGACATGTCG CGCCTGAGCC CCAAGCAGCG TGAGGCGTTC 
GCGCGCGATG GCCGGGCCGC CGAGAGCCTG CCGCCGCCCT CCCTGGGCGA GACGCTGCGC 
GAACCCCATC CCTCCTGGAT CGAGCCGCTC GAGAAGGCCT GGCGGCAGCG TTACGGCGCG 
CAATGA

Protein sequence

MTYSRGLLVA ALSLLPTMGQ AYELSDWESV TEAARGQTVY WNAWGGDPRT NAYIDWVAEQ 
VDKRYAIDLE HVKVGDTGEA VTRVLAEKAA GNDEQGAVDL IWLNGENFAA MKDNDLLYGP 
WAEQLPHFPL TAPEQNPEVR EDFTLPVEGY EAPWGRAQIT FYYDSARVDA PPRSIPALLD 
WARAHPGRFT YPQPPAFLGT TFLKQALLAL TEHREALYAP VDEADFESVT APLWAYLDRL 
HPTLWREGES FPAGGPQMRQ LMGDGALSLA FTFTPSAPAA AVLDYQLPPT TRSYILDDGT 
LGNVHFVAIP FNAQHKAGAL TVANFLLSPE AQARKQDLSL WGDATVLDMS RLSPKQREAF 
ARDGRAAESL PPPSLGETLR EPHPSWIEPL EKAWRQRYGA Q